logo of hello

哈啰强化学习算法工程师-【自动驾驶】

社招全职算法地点:上海状态:招聘

任职要求


任职资格:
1、本科及以上学历,专业方向包括计算机、软件、自动化、模式识别等理工科,工作经验不小于2年;
2、具备较强的编程能力,精通PythonC++语言,熟悉Docker容器化部署,有良好的编程习惯和标准化的代码风格;
3、熟悉UniAD、Pluto、Diffusion Planner等主流…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作职责:
 1、设计并实现面向自动驾驶的强化学习训练框架,提升端到端大模型在稀疏场景下的训练效率和泛化能力;
 2、研发适用于驾驶决策、路径规划与交互博弈的强化学习算法,包括但不限于GRPO、PPO和DPO等,解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。
包括英文材料
学历+
模式识别+
Python+
C+++
Docker+
编程规范+
还有更多 •••
相关职位

logo of mi
社招N0207

1. 负责端到端的预测、决策和规划学习模型研发,解决L4交通场景下的交互决策、轨迹规划问题; 2. 负责数据处理、标注和管理,研发基于数据的模型闭环迭代系统,提升整体效率和性能; 3. 跟踪最新的自动驾驶和人工智能技术动态,进行技术调研和快速验证。

更新于 2023-05-22北京
logo of liauto
社招自动驾驶

1.负责研发和实现理想汽车自动驾驶系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署。 2.专注于开发和实现创新的强化学习算法和架构,推动自动驾驶系统性能的提升,特别是在 MPI 性能方面的突破。 3.参与自动驾驶系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理。 4.跟踪强化学习和自动驾驶领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破。 5.跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。

北京
logo of horizon
校招算法序列

探索下一代端到端自动驾驶系统的强化学习训练范式,构建高效稳定的大规模强化学习闭环训练框架,提升强化学习的数据效率、训练效率、稳定性、场景泛化性,验证scalling law,解决sim2real和长尾问题,推动强化学习算法在物理世界的落地应用。

更新于 2025-07-04北京|上海
logo of momenta
社招

岗位职责: 负责将最前沿的强化学习,监督学习的方法应用到自动驾驶规控领域 参与自动驾驶深度学习框架的搭建和维护,模型自动化生产流程架构设计与优化 参与深度学习算法在数据生产线的研发落地,保障路测数据的高效回流与使用 同感知/规控/测试团队紧密配合,负责量产嵌入式自动驾驶产品中的规控算法集成

更新于 2022-10-11苏州|北京|上海