小鹏汽车【26届校招】强化学习分布式系统工程师
校招全职地点:上海状态:招聘
任职要求
1. 硕士及以上学历,具有机器人、运动控制、自动化、人工智能、计算机等相关背景。 2. 有强化学习(RL)相关产品落地实务经验优先。 3. 扎实的强化学习理论基础,熟悉主流离线/在线RL算法(e.g. PPO, SAC, etc),并具备实际项目应用经验。 4. 精通至少一个主流RL框架,如 Ray-RLlib (精通Ray 加分), rsl_rl, stable-baselines3…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 与电动车动力系统团队深度合作,设计并实现适用于车载动力系统效率优化的强化学习(RL)算法。 2. 利用或基于 Ray-RLlib, rsl_rl, 或 stable-baselines3 等主流框架,搭建高效、分布式的RL训练与部署架构。 3. 推动RL控制策略的sim2real 迁移,并参与小鹏汽车动力系统硬件在环或实车平台的集成与调试工作。 4. 作为AI团队与动力系统部门之间的核心桥梁,负责需求对齐、数据接口规范化和联合调试。 5. 根据业务需求,未来有机会参与 LLM团队针对语言模型后训练RL 框架的搭建与优化。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Ray+
https://github.com/ray-project/ray
Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.
https://www.youtube.com/watch?v=FhXfEXUUQp0
In this video, I'll teach you everything you need to know about Apache Ray!
https://www.youtube.com/watch?v=fMiAyj2kgac
Using powerful machine learning algorithms is easy using Ray.io and Python.
https://www.youtube.com/watch?v=q_aTbb7XeL4
Parallel and Distributed computing sounds scary until you try this fantastic Python library.
还有更多 •••
相关职位
社招2-5年技术
1. 负责滴滴代驾乘客端App、小程序,司机端App,以及运营和营销平台等系统的研发工作; 2. 与产品、设计沟通,并能够针对不同业务需求给出前端技术解决方案; 3. 深度参与App和小程序的性能优化、稳定性保障、架构升级,以及组件化建设等相关工作,提升软件体验和研发效率;
更新于 2025-04-01杭州
实习网易云音乐
1、负责云音乐AI基建平台相关业务相关服务端开发; 2、负责业务AI相关落地; 3、根据产品需求完成服务器端设计、开发以及文档编写等工作; 4、优化系统性能, 改善系统的稳定性及易用性,提升用户体验。
更新于 2025-08-12杭州
实习网易游戏(雷火)
1.与编剧团队合作,共同细化和丰富游戏故事和世界观。 2.基于核心叙事设定和剧本,与关卡、玩法、美术部门密切沟通和合作,设计并协助实现关卡内的叙事内容。 3.规划和跟进叙事内容所需资产的制作和表现,实现高质量的in-game叙事体验。 4.与程序、技术策划合作,协助设计和完善叙事落地的相关工具。
更新于 2025-06-21杭州