
哈啰强化学习算法工程师-【自动驾驶】
社招全职算法地点:上海状态:招聘
任职要求
任职资格: 1、本科及以上学历,专业方向包括计算机、软件、自动化、模式识别等理工科,工作经验不小于2年; 2、具备较强的编程能力,精通Python及C++语言,熟悉Docker容器化部署,有良好的编程习惯和标准化的代码风格; 3、熟悉UniAD、Pluto、Diffusion Planner等主流…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
工作职责: 1、设计并实现面向自动驾驶的强化学习训练框架,提升端到端大模型在稀疏场景下的训练效率和泛化能力; 2、研发适用于驾驶决策、路径规划与交互博弈的强化学习算法,包括但不限于GRPO、PPO和DPO等,解决L4 Robotaxi场景中的安全性、强交互博弈和长尾场景等问题。
包括英文材料
学历+
模式识别+
https://www.mathworks.com/discovery/pattern-recognition.html
Pattern recognition is the process of classifying input data into objects, classes, or categories using computer algorithms based on key features or regularities.
https://www.microsoft.com/en-us/research/wp-content/uploads/2006/01/Bishop-Pattern-Recognition-and-Machine-Learning-2006.pdf
Pattern recognition has its origins in engineering, whereas machine learning grew out of computer science.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Docker+
https://www.youtube.com/watch?v=GFgJkfScVNU
Master Docker in one course; learn about images and containers on Docker Hub, running multiple containers with Docker Compose, automating workflows with Docker Compose Watch, and much more. 🐳
https://www.youtube.com/watch?v=kTp5xUtcalw
Learn how to use Docker and Kubernetes in this complete hand-on course for beginners.
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
还有更多 •••
相关职位
社招N0207
1. 负责端到端的预测、决策和规划学习模型研发,解决L4交通场景下的交互决策、轨迹规划问题; 2. 负责数据处理、标注和管理,研发基于数据的模型闭环迭代系统,提升整体效率和性能; 3. 跟踪最新的自动驾驶和人工智能技术动态,进行技术调研和快速验证。
更新于 2023-05-22北京
社招自动驾驶
1.负责研发和实现理想汽车自动驾驶系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署。 2.专注于开发和实现创新的强化学习算法和架构,推动自动驾驶系统性能的提升,特别是在 MPI 性能方面的突破。 3.参与自动驾驶系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理。 4.跟踪强化学习和自动驾驶领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破。 5.跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
北京

校招算法序列
探索下一代端到端自动驾驶系统的强化学习训练范式,构建高效稳定的大规模强化学习闭环训练框架,提升强化学习的数据效率、训练效率、稳定性、场景泛化性,验证scalling law,解决sim2real和长尾问题,推动强化学习算法在物理世界的落地应用。
更新于 2025-07-04北京|上海
