logo of liauto

理想汽车具身智能运控算法工程师(强化学习方向)

校招全职算法地点:北京状态:招聘

任职要求


1. 具有应用数学、计算机科学、人工智能、机器人等相关领域的硕士或博士学位,或在上述领域有同等工作经验;
2. 具备强化学习的深入理解与应用经验,能够设计和优化复杂的决策系统,特别是在机器人领域的实践经验者优先;
3. 熟悉强化学习的理论与实践,精通主流强化学习框架(如TensorFlowPyTorch、JAX等);
4. 熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 探索具身智能系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署;
2. 专注于开发和实现创新的强化学习算法和架构,推动具身智能系统性能的提升,特别是在 MPI 性能方面的突破;
3. 探索具身智能系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理;
4. 跟踪强化学习和具身智能领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破;
5. 跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
包括英文材料
学历+
强化学习+
TensorFlow+
PyTorch+
还有更多 •••
相关职位

logo of liauto
校招算法

1. 探索用于强化学习的具身智能仿真框架,提升仿真系统在强化学习场景下的效能; 2. 研究并应用强化学习reward model设计方法,结合各种场景设计奖励函数,以对具身智能决策和行为进行有效评价; 3. 参与VLA架构下仿真系统的设计与优化,确保仿真环境下具身智能算法运行的可靠性与高效率; 4. 利用历史数据和世界模型技术和资产搭建高度真实的仿真引擎,实现具身智能算法的高效闭环验证,确保仿真结果与实际车端表现高度一致。

北京
logo of amap
社招3年以上技术类-算法

负责下一代机器人通用运动控制器的研发与工程落地,具体包括: ● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行; ● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力; ● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略; ● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。

更新于 2025-12-15北京
logo of mi
校招

1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。

更新于 2025-06-23北京
logo of mi
实习

1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。

更新于 2025-04-23北京