logo of sensetime

商汤多模态生成算法研究员-实习生

实习兼职算法研究地点:北京 | 上海状态:招聘

任职要求


1. 教育背景:计算机、人工智能等相关专业硕士或者博士,需有扎实数学基础。
2. 专业技能:对生成模型(如扩散模型、GAN、VAE)和多模态大模型有深入理解,跟踪 AIGC 领域前沿(如 Diffusion Policy、World Model 在自动驾驶和机器人领域的应用),具备将前沿技术转化为工程方案的能力。
3. 工作经验:参与行业前沿的技术研发,主导从算法设计到闭环落地的全流程,技术影响力直接赋能量产车型的优先,能独立完成模型设计、训练等工作。具备自动驾驶仿真平台(如 CARLA、Gazebo)二次开发经验,或主导过 “世界模型 + 端到端训练” 完整链路搭建项目者优先。
4. 基础技能:系统掌握计算机视觉(如多目标跟踪、BEV/Transformer 架构)、多模态大模型(VLM、LLM)或强化学习(如 PPO、SAC 算法)理论,熟悉自动驾驶规控算法(如运动预测、路径规划)的建模逻辑。精通一种深度学习框架(PyTorch/MindSpore),有大型生成模型开发经验(如多模态模型、高分辨率场景渲染模型)等。
5. 能力素质:具备科研、创新思维,能解决复杂技术难题,有良好团队协作、沟通及学习能力,对该领域充满热情并关注行业动态。

工作职责


1. 算法研发:聚焦自动驾驶、车载或机器人领域的算法和模型研发,不限于世界模型、视频生成模型、多模态大模型和VLA模型。
2. 业务落地:负责车载和自动驾驶业务的研究、设计、开发和优化工作。参与项目的需求分析、设计评审和代码评审。跟踪和研究领域的前沿技术和趋势,为项目提供技术支持。
包括英文材料
大模型+
自动驾驶+
算法+
Gazebo+
OpenCV+
Transformer+
强化学习+
深度学习+
PyTorch+
相关职位

logo of sohu
实习技术

[团队主要工作方向]: 1、负责媒体专业领域大语言模型的构建与迭代,主要是预训练和对齐阶段特定算法模块的建设工作; 2、负责扩散模型等多模态内容生成模型和算法的建设和应用,优化AI内容创作链路中的具体算法环节; 3、负责自然语言、图像、视频等多模态理解算法研发工作,丰富化内容理解的手段,赋能搜狐网/搜狐视频的推荐、搜索场景; 4、探索大模型能力在媒体和视频业务流程中的提效应用和面向C端用户的产品能力输出。 [] 1、负责领域大模型构建与迭代过程中的特定关键算法环节研究,赋能搜狐网&搜狐视频业务’ 2、负责扩散模型在连续内容创作场景的中设计与研究,赋能搜狐网&搜狐视频业务。 [

logo of bytedance
实习A256365

Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、成为研究型实习生,在你热爱的课题方向上,探索机器学习算法与系统领域最具挑战的长期关键问题; 2、寻找志同道合的伙伴,自由组建你的课题小组,享受充足的算力与数据资源支持; 3、获得长周期的培养与成长,大牛导师深度指导,国内外顶尖学者交流机会。

更新于 2025-03-19
logo of bytedance
实习A13426

Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、成为研究型实习生,在你热爱的课题方向上,探索机器学习算法与系统领域最具挑战的长期关键问题; 2、寻找志同道合的伙伴,自由组建你的课题小组,享受充足的算力与数据资源支持; 3、获得长周期的培养与成长,大牛导师深度指导,国内外顶尖学者交流机会。

更新于 2025-03-19
logo of bytedance
实习A243989

Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动豆包大模型团队(Seed)成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,并探索新的交互。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。豆包大模型团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、成为研究型实习生,在你热爱的课题方向上,探索机器学习算法与系统领域最具挑战的长期关键问题; 2、寻找志同道合的伙伴,自由组建你的课题小组,享受充足的算力与数据资源支持; 3、获得长周期的培养与成长,大牛导师深度指导,国内外顶尖学者交流机会。

更新于 2025-03-19