理想汽车具身智能运控算法工程师(强化学习方向)
任职要求
1. 具有应用数学、计算机科学、人工智能、机器人等相关领域的硕士或博士学位,或在上述领域有同等工作经验; 2. 具备强化学习的深入理解与应用经验,能够设计和优化复杂的决策系统,特别是在机器人领域的实践经验者优先; 3. 熟悉强化学习的理论与实践,精通主流强化学习框架(如TensorFlow、PyTorch、JAX等); 4. 熟练掌握Python,具备深厚的软件工程能力,能够高效进行大规模分布式计算与内存优化; 5. 具有深度学习基础,熟悉优化算法、损失函数和神经网络架构,能够处理大规模数据集和高效训练; 6. 在大规模分布式计算和并行处理方面有丰富经验,能够解决大模型训练中的计算瓶颈; 7. 具备良好的团队合作能力,能够跨职能合作解决复杂系统级问题。
工作职责
1. 探索具身智能系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署; 2. 专注于开发和实现创新的强化学习算法和架构,推动具身智能系统性能的提升,特别是在 MPI 性能方面的突破; 3. 探索具身智能系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理; 4. 跟踪强化学习和具身智能领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破; 5. 跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
1. 探索用于强化学习的具身智能仿真框架,提升仿真系统在强化学习场景下的效能; 2. 研究并应用强化学习reward model设计方法,结合各种场景设计奖励函数,以对具身智能决策和行为进行有效评价; 3. 参与VLA架构下仿真系统的设计与优化,确保仿真环境下具身智能算法运行的可靠性与高效率; 4. 利用历史数据和世界模型技术和资产搭建高度真实的仿真引擎,实现具身智能算法的高效闭环验证,确保仿真结果与实际车端表现高度一致。
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
1、负责基于强化学习/模仿学习的双足运动控制算法的研发和调试,或负责具身智能双臂操作算法的研发和调试,确保算法的高效性和稳定性; 2、在真实机器人平台上进行训练模型的部署与调试,深入分析并解决sim2real GAP问题,确保模拟环境与真实环境之间的有效转化; 3、跟踪前沿机器人双足和双臂规划控制的研究方向,参与相关算法的验证与评估,推动技术的持续创新与应用; 4、开发机械臂底层运控算法 ,设计并实现轨迹优化、碰撞检测等核心算法,确保机器人能够高效、准确地完成复杂场景下的任务; 5、跨团队协作:与感知、硬件等相关团队紧密合作,参与机器人系统的级联调试与问题攻关,推动技术闭环的落地实施,确保项目的顺利推进。