logo of hello

哈啰智驾决策规划算法工程师/专家(RL方向)-【自动驾驶】

社招全职算法地点:北京 | 上海状态:招聘

任职要求


1. 计算机科学、自动化、机器学习、机器人学等相关专业本科及以上学历;
2. 具备扎实的强化学习理论基础,熟悉主流RL算法(PPO、SAC、TD3、IQL等),并至少在一项自动驾驶或机器人项目中具有RL算法落地经验;
3. 熟练掌握Python/C++,熟悉PyTorch等深度学习框架,具备大规模强化学习分布式训练(如Ray、Kubernetes)或仿真平台开发经验者优先;
4. 熟悉自动驾驶决策规划常见方法(如MDP/POMDP、搜索与优化算法),并能够将强化学习与传统规划方法(如MPC、Lattice)结合解决实际问题;
5. 具备良好的数学基础…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责基于强化学习(如Online/Offline RL、Model-based RL)的自动驾驶行为决策与运动规划算法研发,重点解决结构化道路(高速、城市快速路)及非结构化场景(自动泊车)中的动态交互与博弈问题;
2. 针对复杂动态场景(密集车流、无保护路口、人车混流),设计基于数据驱动的决策规划算法,通过大规模分布式训练系统提升策略的智能性、安全性及泛化能力;
3. 构建与迭代仿真环境(如CARLA、NVIDIA Isaac)与世界模型,推动强化学习策略的仿真训练与实车迁移(Sim2real),形成“真实数据→仿真训练→实车验证”的闭环优化;
4. 参与全栈自动驾驶决策控制系统的开发,对接感知、预测、端到端模块,实现基于强化学习的决策规划算法在车载平台上的部署、性能优化与实车路测;
5. 跟踪强化学习在自动驾驶领域的前沿进展(如大模型与RL结合、逆强化学习、多智能体博弈),进行技术预研与算法创新,推动研究成果在量产项目中的应用与落地。
包括英文材料
机器学习+
学历+
强化学习+
算法+
自动驾驶+
Python+
C+++
PyTorch+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁网络基础设施团队,为蚂蚁提供稳定高效的网络连接服务。我们致力于研发和建设一流的网络基础设施,通过技术驱动来不断优化通算和智算业务连接成本、性能和稳定性。 ● 负责蚂蚁AIDC网络架构设计、演进以及交换机或网卡协议栈等研发优化落地 ● 通过算法-框架-工程协同实现成本和性能全局最优

更新于 2025-04-03杭州
logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责推理网关核心能力设计和开发; ● 通过创新的流量调度算法减少推理成本;

更新于 2025-04-03北京|杭州|成都
logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责集合通信库的设计和研发; ● 通过稳定性建设和通信优化提升大模型训练效率和减少推理成本;

更新于 2025-04-03北京|杭州|成都
logo of netease
社招网易数智

1、负责网易大数据平台的Iceberg等大数据组件迭代研发。 2、负责Iceberg等技术在业务上的实践落地以及问题分析诊断。 3、 参与Hive等组件在大数据元数据服务方面的稳定性建设以及问题诊断。

更新于 2025-04-17杭州