logo of xpeng

小鹏汽车【26届校招】强化学习分布式系统工程师

校招全职地点:上海状态:招聘

任职要求


1. 硕士及以上学历,具有机器人、运动控制、自动化、人工智能、计算机等相关背景。
2. 有强化学习(RL)相关产品落地实务经验优先。
3. 扎实的强化学习理论基础,熟悉主流离线/在线RL算法(e.g. PPO, SAC, etc),并具备实际项目应用经验。
4. 精通至少一个主流RL框架,如 Ray-RLlib (精通Ray 加分), rsl_rl, stable-baselines3…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 与电动车动力系统团队深度合作,设计并实现适用于车载动力系统效率优化的强化学习(RL)算法。
2. 利用或基于 Ray-RLlib, rsl_rl, 或 stable-baselines3 等主流框架,搭建高效、分布式的RL训练与部署架构。
3. 推动RL控制策略的sim2real 迁移,并参与小鹏汽车动力系统硬件在环或实车平台的集成与调试工作。
4. 作为AI团队与动力系统部门之间的核心桥梁,负责需求对齐、数据接口规范化和联合调试。
5. 根据业务需求,未来有机会参与 LLM团队针对语言模型后训练RL 框架的搭建与优化。
包括英文材料
学历+
强化学习+
算法+
Ray+
还有更多 •••
相关职位

logo of didi
社招2-5年技术

1. 负责滴滴代驾乘客端App、小程序,司机端App,以及运营和营销平台等系统的研发工作; 2. 与产品、设计沟通,并能够针对不同业务需求给出前端技术解决方案; 3. 深度参与App和小程序的性能优化、稳定性保障、架构升级,以及组件化建设等相关工作,提升软件体验和研发效率;

更新于 2025-04-01杭州
logo of netease
实习网易云音乐

1、负责云音乐AI基建平台相关业务相关服务端开发; 2、负责业务AI相关落地; 3、根据产品需求完成服务器端设计、开发以及文档编写等工作; 4、优化系统性能, 改善系统的稳定性及易用性,提升用户体验。

更新于 2025-08-12杭州
logo of netease
实习网易游戏(雷火)

1.与编剧团队合作,共同细化和丰富游戏故事和世界观。 2.基于核心叙事设定和剧本,与关卡、玩法、美术部门密切沟通和合作,设计并协助实现关卡内的叙事内容。 3.规划和跟进叙事内容所需资产的制作和表现,实现高质量的in-game叙事体验。 4.与程序、技术策划合作,协助设计和完善叙事落地的相关工具。

更新于 2025-06-21杭州
logo of aliyun
社招诚云科技

1、负责资产管理流程的落地、推进问题处理; 2、负责对资产管理员的管理,识别人员和资产风险,制定解决方案; 3、负责所辖机房的资产指标达成; 4、跟进所辖机房的资产到货、入库、盘点、上架、下架、报废处置等全部流程; 5、按照管理要求执行其他资产处置工作。

更新于 2026-01-26乌兰察布|嘉兴|中卫