logo of liauto

理想汽车具身智能运控算法工程师(强化学习方向)

校招全职算法地点:北京状态:招聘

任职要求


1. 具有应用数学、计算机科学、人工智能、机器人等相关领域的硕士或博士学位,或在上述领域有同等工作经验;
2. 具备强化学习的深入理解与应用经验,能够设计和优化复杂的决策系统,特别是在机器人领域的实践经验者优先;
3. 熟悉强化学习的理论与实践,精通主流强化学习框架(如TensorFlowPyTorchJAX等);
4. 熟练掌握Python,具备深厚的软件工程能力,能够高效进行大规模分布式计算与内存优化;
5. 具有深度学习基础,熟悉优化算法、损失函数和神经网络架构,能够处理大规模数据集和高效训练;
6. 在大规模分布式计算和并行处理方面有丰富经验,能够解决大模型训练中的计算瓶颈;
7. 具备良好的团队合作能力,能够跨职能合作解决复杂系统级问题。

工作职责


1. 探索具身智能系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署;
2. 专注于开发和实现创新的强化学习算法和架构,推动具身智能系统性能的提升,特别是在 MPI 性能方面的突破;
3. 探索具身智能系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理;
4. 跟踪强化学习和具身智能领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破;
5. 跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
包括英文材料
学历+
强化学习+
TensorFlow+
PyTorch+
JAX+
Python+
深度学习+
算法+
大模型+
相关职位

logo of liauto
校招算法

1. 探索用于强化学习的具身智能仿真框架,提升仿真系统在强化学习场景下的效能; 2. 研究并应用强化学习reward model设计方法,结合各种场景设计奖励函数,以对具身智能决策和行为进行有效评价; 3. 参与VLA架构下仿真系统的设计与优化,确保仿真环境下具身智能算法运行的可靠性与高效率; 4. 利用历史数据和世界模型技术和资产搭建高度真实的仿真引擎,实现具身智能算法的高效闭环验证,确保仿真结果与实际车端表现高度一致。

logo of mi
校招

1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。

更新于 2025-06-23
logo of mi
实习

1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。

更新于 2025-04-23
logo of honor
社招1年以上研发类

1、负责基于强化学习/模仿学习的双足运动控制算法的研发和调试,或负责具身智能双臂操作算法的研发和调试,确保算法的高效性和稳定性; 2、在真实机器人平台上进行训练模型的部署与调试,深入分析并解决sim2real GAP问题,确保模拟环境与真实环境之间的有效转化; 3、跟踪前沿机器人双足和双臂规划控制的研究方向,参与相关算法的验证与评估,推动技术的持续创新与应用; 4、开发机械臂底层运控算法 ,设计并实现轨迹优化、碰撞检测等核心算法,确保机器人能够高效、准确地完成复杂场景下的任务; 5、跨团队协作:与感知、硬件等相关团队紧密合作,参与机器人系统的级联调试与问题攻关,推动技术闭环的落地实施,确保项目的顺利推进。

更新于 2025-02-25