logo of xpeng

小鹏汽车强化学习分布式系统实习生

实习兼职地点:上海 | 深圳状态:招聘

任职要求


职位要求:
1. 硕士及以上学历,具有机器人、运动控制、自动化、人工智能、计算机等相关背景。
2. 需有1年以上强化学习(RL)相关产品落地实务经验。
3. 扎实的强化学习理论基础,熟悉主流离线/在线RL算法(e.g. PPO, SAC, etc),并具备实际项目应用经验。
4. 精通至少一个主流RL框架,如 Ray-RLlib (精通Ray 加分), rsl_rl, stable-basel…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 与电动车动力系统团队深度合作,设计并实现适用于车载动力系统效率优化的强化学习(RL)算法。
2. 利用或基于 Ray-RLlib, rsl_rl, 或 stable-baselines3 等主流框架,搭建高效、分布式的RL训练与部署架构。
3. 推动RL控制策略的sim2real 迁移,并参与小鹏汽车动力系统硬件在环或实车平台的集成与调试工作。
4. 作为AI团队与动力系统部门之间的核心桥梁,负责需求对齐、数据接口规范化和联合调试。
5. 根据业务需求,未来有机会参与 LLM团队针对语言模型后训练RL 框架的搭建与优化。
包括英文材料
学历+
强化学习+
算法+
Ray+
还有更多 •••
相关职位

logo of meituan
实习核心本地商业-基

参与Agentic RL系统的工程研究和落地,工作包括/不限于:Agentic RL系统部分功能的设计和实现、RL性能优化、RL算法实现、数据合成链路设计和实现等 跟进公司内外AI Agent方向的技术演进,进行Agentic RL相关的技术调研。

更新于 2025-08-26北京
logo of bytedance
实习A53844

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动AML机器学习训练框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-02-14北京
logo of bytedance
实习A09768

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动AML机器学习训练框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-02-14上海
logo of xpeng
实习

1. 基于Isaac Gym/MuJoCo搭建高保真仿真环境,优化人形机器人运动控制RL训练的并行效率与物理精度; 2. 开发3DGS/NeRF等动态场景渲染管线,支持视觉-动力学联合仿真(sim2real迁移); 3. 构建生成式世界模型驱动的仿真系统,实现动态场景自动生成与自适应难度调控; 4. 设计分布式仿真架构,支持万级机器人实例的实时交互与数据采集。

更新于 2025-04-28深圳