理想汽车具身智能运控算法工程师(强化学习方向)
任职要求
1. 计算机科学、软件工程、自动化、电子工程或相关专业本科及以上学历; 2. 扎实的C++编程能力,具备在大型项目中进行开发的实际经验; 3. 有丰富的linux开发经验,熟悉大规模分布式计算系统架构; 4. 具备一定的强化学习理论理解,熟悉reward design在强化学习中的作用,能够针对VLA模型定义合理的奖励机制,优化系统表现; 5. 理解VLA系统算法模块及其基本输入输出; 优先考虑: - 有实际参与机器人VLA相关领域的大型项目经验; - 熟悉Python或其他研发常用语言,熟练进行跨语言协作和工具链整合; - 在强化学习、世界模型、sim agent领域有相关论文发表或项目经验者。
工作职责
1. 探索用于强化学习的具身智能仿真框架,提升仿真系统在强化学习场景下的效能; 2. 研究并应用强化学习reward model设计方法,结合各种场景设计奖励函数,以对具身智能决策和行为进行有效评价; 3. 参与VLA架构下仿真系统的设计与优化,确保仿真环境下具身智能算法运行的可靠性与高效率; 4. 利用历史数据和世界模型技术和资产搭建高度真实的仿真引擎,实现具身智能算法的高效闭环验证,确保仿真结果与实际车端表现高度一致。
1. 探索具身智能系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署; 2. 专注于开发和实现创新的强化学习算法和架构,推动具身智能系统性能的提升,特别是在 MPI 性能方面的突破; 3. 探索具身智能系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理; 4. 跟踪强化学习和具身智能领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破; 5. 跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
1、负责基于强化学习/模仿学习的双足运动控制算法的研发和调试,或负责具身智能双臂操作算法的研发和调试,确保算法的高效性和稳定性; 2、在真实机器人平台上进行训练模型的部署与调试,深入分析并解决sim2real GAP问题,确保模拟环境与真实环境之间的有效转化; 3、跟踪前沿机器人双足和双臂规划控制的研究方向,参与相关算法的验证与评估,推动技术的持续创新与应用; 4、开发机械臂底层运控算法 ,设计并实现轨迹优化、碰撞检测等核心算法,确保机器人能够高效、准确地完成复杂场景下的任务; 5、跨团队协作:与感知、硬件等相关团队紧密合作,参与机器人系统的级联调试与问题攻关,推动技术闭环的落地实施,确保项目的顺利推进。