小米顶尖应届-决策规划大模型工程师-汽车

校招全职2025-05-22地点：北京状态：招聘

扫码手机上打开

任职要求

1. 计算机、自动化、数学、自动驾驶等相关方向硕士及以上学历；
2. 熟练掌握linux下C++开发，良好的数据结构和算法基础;
3. 熟悉深度学习框架，熟悉CNN、LSTM、GRU、Transformers等网络结构及其训练。

以下三点需满足至少一点：
1. 熟悉常见的基于模型的规控与端到端算法；
2. 熟悉…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 开发基于模型的决策规划系统，解决城市、高速等场景下的交互决策、轨迹规划问题；
2. 开发大规模强化学习算法与系统，完成Agent在虚拟环境中的训练以及Sim2Real的部署。

【课题名称】
L3自动驾驶关键技术研究-决策规划大模型
【课题内容】
1. 开发基于模型的决策规划系统，解决城市、高速等场景下的交互决策、轨迹规划问题；
2. 开发大规模强化学习算法与系统，完成Agent在虚拟环境中的训练以及Sim2Real的部署。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

自动驾驶+

学历+

Linux+

C+++

数据结构+

还有更多 •••

登录查看完整学习资料

相关职位

顶尖应届-决策规划大模型工程师-汽车

校招

1. 开发基于模型的决策规划系统，解决城市、高速等场景下的交互决策、轨迹规划问题； 2. 开发大规模强化学习算法与系统，完成Agent在虚拟环境中的训练以及Sim2Real的部署。【课题名称】 L3自动驾驶关键技术研究-决策规划大模型【课题内容】 1.开发基于模型的决策规划系统，解决城市、高速等场景下的交互决策、轨迹规划问题； 2.开发大规模强化学习算法与系统，完成Agent在虚拟环境中的训练以及Sim2Real的部署；

更新于 2025-05-22上海

顶尖应届-自动驾驶VLA大模型工程师-汽车

校招

1. 参与研究与开发融合视觉与语言理解的端到端自动驾驶新范式； 2. 负责视觉语言大模型（VLA）相关算法的设计、实现与优化，提升模型的环境感知、决策规划能力； 3. 探索如何利用VLA增强自动驾驶系统的泛化能力及人机交互的自然性； 4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试； 5. 跟踪VLA及相关领域（多模态学习、大模型等）的前沿技术动态； 6. 发表高水平论文至国际顶会顶刊，参加相关领域的国内外顶级学术会议。【课题名称】自动驾驶VLA大模型预研【课题内容】探索融合视觉语言行为大模型（VLA）至端到端自动驾驶的新范式，实现更强的自动驾驶泛化能力和更自然的交互方式。

更新于 2025-06-26北京

顶尖应届-具身基座VLA大模型工程师-汽车

校招

1. 参与研究与开发融合视觉与语言理解的端到端机器人新范式； 2. 负责视觉语言大模型（VLA）相关算法的设计、实现与优化，提升模型的环境感知、决策规划能力； 3. 探索如何利用VLA增强机器人的泛化能力及人机交互的自然性； 4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试。 5.跟踪VLA及相关领域（多模态学习、大模型等）的前沿技术动态。 6. 发表高水平论文至国际顶会顶刊，参加相关领域的国内外顶级学术会议。【课题名称】具身基座VLA大模型预研【课题内容】探索如何利用VLA与Foundation Model技术提升机器人的环境理解、任务规划与泛化执行能力，构建面向未来的通用智能体。

更新于 2025-06-26北京

高德-AIGC多模态生成&理解算法工程师/专家-北京

社招3年以上技术类-算法

团队介绍：高德地图机器学习研发部是公司AI核心技术引擎，聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地，支撑亿级用户产品，同时长期投入前沿探索，在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文，多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源，鼓励创新突破，诚邀你与顶尖算法专家并肩，共同定义AI的未来！如果你渴望挑战多模态与生成式AI的技术巅峰，在视频、图像、大模型的交叉领域实现突破，欢迎加入我们！团队的github页面是：https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发，见证技术直接赋能业务； • 与学术大牛和工业界专家共事，持续提升技术视野； • 顶配算力资源+开放创新氛围，支持前沿探索与顶会论文发表。具体职责包括但不限于： 1. 视频生成：负责视频生成技术的前沿技术的研究，对AIGC的diffusion和auto-regressive技术有深入了解，在T2I/AIGCT2V/I2V上面有一定的研究，图文对齐，长视频生成等有一定的研究，做好视频生成在高德业务（广告，POI详情页等）中的进行落地。 2. 视频理解：能够使用和优化多模态大模型对用户上传的视频进行质量理解，标签，densecaption，视频summary等生成，作用到视频的搜索，广告，推荐等业务的落地。 3. 世界模型：参与世界模型的构建，能够使用最新的视频生成技术，3D技术等构建符合人类物理规律的统一的世界模型，在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀，形成顶会论文和专利。

更新于 2026-01-23北京