理想汽车具身智能运控算法工程师(强化学习方向)
校招全职算法地点:北京状态:招聘
任职要求
1. 具有应用数学、计算机科学、人工智能、机器人等相关领域的硕士或博士学位,或在上述领域有同等工作经验; 2. 具备强化学习的深入理解与应用经验,能够设计和优化复杂的决策系统,特别是在机器人领域的实践经验者优先; 3. 熟悉强化学习的理论与实践,精通主流强化学习框架(如TensorFlow、PyTorch、JAX等); 4. 熟…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 探索具身智能系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署; 2. 专注于开发和实现创新的强化学习算法和架构,推动具身智能系统性能的提升,特别是在 MPI 性能方面的突破; 3. 探索具身智能系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理; 4. 跟踪强化学习和具身智能领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破; 5. 跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位
校招算法
1. 探索用于强化学习的具身智能仿真框架,提升仿真系统在强化学习场景下的效能; 2. 研究并应用强化学习reward model设计方法,结合各种场景设计奖励函数,以对具身智能决策和行为进行有效评价; 3. 参与VLA架构下仿真系统的设计与优化,确保仿真环境下具身智能算法运行的可靠性与高效率; 4. 利用历史数据和世界模型技术和资产搭建高度真实的仿真引擎,实现具身智能算法的高效闭环验证,确保仿真结果与实际车端表现高度一致。
北京
社招3年以上技术类-算法
负责下一代机器人通用运动控制器的研发与工程落地,具体包括: ● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行; ● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力; ● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略; ● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。
更新于 2025-12-15北京
校招
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
更新于 2025-06-23北京