哈啰强化学习算法工程师-【自动驾驶】

社招全职算法2025-11-25地点：上海状态：招聘

扫码手机上打开

任职要求

任职资格：
1、本科及以上学历，专业方向包括计算机、软件、自动化、模式识别等理工科，工作经验不小于2年；
2、具备较强的编程能力，精通Python及C++语言，熟悉Docker容器化部署，有良好的编程习惯和标准化的代码风格；
3、熟悉UniAD、Pluto、Diffusion Planner等主流…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

工作职责：
 1、设计并实现面向自动驾驶的强化学习训练框架，提升端到端大模型在稀疏场景下的训练效率和泛化能力；
 2、研发适用于驾驶决策、路径规划与交互博弈的强化学习算法，包括但不限于GRPO、PPO和DPO等，解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

模式识别+

Python+

C+++

Docker+

编程规范+

还有更多 •••

登录查看完整学习资料

相关职位

自动驾驶深度学习预测规划算法工程师（J79397）

社招IDG

-负责自动驾驶系统中基于深度学习的轨迹、意图预测算法的研究与实现 -研发自动驾驶决策规划大模型，利用模仿学习、强化学习等技术，实现复杂交通场景下的端到端自动驾驶 -参与端到端智驾系统设计与讨论，输出技术架构与设计方案 -负责智驾系统问题分析优化，识别模型算法与数据缺陷，并做出改进 -处理大规模数据集，进行数据清洗、特征提取、模型训练和评估，优化算法的性能和效果

更新于 2024-10-12北京

蚂蚁集团-算法工程师-具身智能方向

社招3年以上技术类-算法

1. 路径规划 ‒ 开发适用于多种场景（如机器人导航、自动驾驶、无人机等）的路径规划算法； ‒ 实现经典和前沿的全局及局部路径规划方法（如 A*、Dijkstra、RRT、DWA 等），优化路径规划的效率和鲁棒性； ‒ 处理动态环境中的路径生成和调整，解决复杂场景下的避障问题。 2. 行动决策 ‒ 研究并实现具身智能体的行动决策算法，设计任务分解和行为选择的逻辑； ‒ 基于行为树（Behavior Tree）、有限状态机（FSM）等方法，构建模块化的决策框架； ‒ 开发多智能体协作与竞争的行动决策模型，支持复杂交互任务的执行。 3. 强化学习（Reinforcement Learning，RL） ‒ 针对具身智能场景（如机械臂控制、机器人动态避障、导航等），设计强化学习的 reward 函数和训练策略； ‒ 实现主流深度强化学习算法（如 DQN、DDPG、PPO、SAC 等），解决高维连续控制与探索问题； ‒ 优化强化学习模型的收敛速度和鲁棒性，提升算法在实际场景中的表现。 4. 模仿学习（Imitation Learning，IL） ‒ 通过专家示范数据（如轨迹、动作序列）训练智能体，实现模仿人类/智能体行为； ‒ 应用行为克隆（Behavior Cloning, BC）、逆强化学习（Inverse Reinforcement Learning, IRL）等技术解决稀疏奖励问题； ‒ 结合模仿学习与强化学习，提升智能体在复杂任务中的学习和泛化能力。 5. 算法优化与工程实现 ‒ 优化算法的计算效率和资源占用，适配实时性要求；‒ 在仿真环境（如 Gazebo、PyBullet、Mujoco 等）和真实设备中验证算法性能； ‒ 配合嵌入式团队完成算法在终端设备上的部署与优化。 6. 技术研究与创新 ‒ 跟踪具身智能领域的前沿算法进展，探索新技术的实际应用； ‒ 研究多模态感知与决策（如视觉、语音、触觉）的融合方法，提升智能体的环境理解与行动能力； ‒ 参与长期自主学习、在线学习和自适应学习系统的设计与开发。

更新于 2026-01-14上海

高德-多模态大模型/端侧部署算法工程师/专家-视觉团队

社招3年以上技术类-算法

我们是谁？作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎，持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新岗位职责： 1. 多模态大模型研发与应用负责多模态大模型的核心架构设计，研究并实现图片、视频、文本等跨模态特征对齐、融合与表征学习方法，负责多模态大模型的数据准备、高效训练（包括但不限于预训练、SFT、强化学习等）、推理加速等。 2. 模型优化与小型化部署负责多模态大模型的轻量化设计、压缩与加速，确保模型在端侧设备上的高效运行。针对高德地图的实际业务场景，优化模型性能，平衡精度与效率。 3. 创新性研究与落地跟踪端侧生成式AI（Edge Generative AI）、强化学习（PPO、GRPO等）、智能Agent等前沿技术，探索多模态大模型在自动驾驶、智能导航等领域的潜在应用。将研究成果快速转化为实际产品功能，推动技术创新与业务增长。

更新于 2026-02-02北京

高德-多模态大模型应用算法工程师-视觉技术团队

社招3年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？挑战世界级技术难题，追求智能上限用AI驱动国民级APP的产品迭代和颠覆式创新我们正在寻找对多模态技术充满热情的算法工程师，加入我们的研发团队。您将专注于多模态理解与生成，推动其在高德扫街榜等热门应用中落地，为用户提供更智能、更沉浸的服务。主要职责： 1、多模态大模型研发：开发业界领先的图文多模态大模型，实现高质量场景理解和内容生成； 2、模型优化与性能提升：优化多模态模型的推理速度和计算效率，支持端侧部署。探索适合大模型的压缩与加速技术（包括但不限于量化、剪枝、知识蒸馏等）； 3、业务场景落地：将多模态技术应用于扫街榜等实际业务场景，与产品、工程团队合作，推动技术从研发到上线的全流程落地； 4、前沿技术探索：持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势，提出创新性解决方案。

更新于 2025-12-11北京