logo of mi

小米具身算法工程师/专家

社招全职A16207地点:北京状态:招聘

任职要求


1、机器人、计算机、人工智能等相关领域硕士及以上学历,有大模型在机器人领域应用经验者优先; 
2、掌握模仿学习,强化学习机器学习领域的基础理论和经典算法,熟悉Pytorch或TensorFlow等深度学习框架;
3、熟悉多模态大模型的训练流程,包括数据预处理、预训练、模型调优和验证…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责机器人多模态大模型的开发,提升机器人对物理世界和人类语言的理解能力,以解决通用场景下的多任务操作问题; 
2、优化模型框架和算法组件,利用视觉,语音,本体感知等多模态信息实现在不同应用场景下的功能泛化和长序列动作; 
3、深度参与数据构建、模型训练和评测部署,支持模型算法在机器人控制系统中的集成,确保算法的实时性和稳定性;
4、结合生成式AI与多模态技术,探索机器人世界模型在实际场景的落地与应用潜力;
包括英文材料
学历+
大模型+
强化学习+
机器学习+
算法+
还有更多 •••
相关职位

logo of didi
社招技术

1、研发基于人形机器人平台(轮式、足式)的通用型具身算法,实现在开放世界中自主导航移动、物理交互与操纵任务; 2、研发基于多模态具身大模型、扩散模型等前沿AI技术的多模态(视觉、语言)交互能力,以及机器人行为的智能决策与规划;

更新于 2025-09-26北京
logo of amap
社招3年以上技术类-算法

研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。

更新于 2025-12-24北京
logo of amap
社招3年以上技术类-算法

我们是谁? 具身智能AI算法团队,致力于打造自主研发的机器人产品。我们正组建一支以AI技术为基石、汇聚多领域顶尖人才的全栈自研算法团队,目标是构建能够与物理世界交互、具备自主理解决策、自主行动的智能机器人 1、主导或深度参与VLA/LBM模型的架构设计、训练策略优化与多模态对齐机制研究,提升智能体在开放环境中的泛化与推理能力; 2、构建面向具身智能的空间计算系统,包括但不限于:3D场景理解、动态环境建模、跨模态空间表征学习、物理交互预测等; 3、探索基础感知技术(如多传感器融合、SLAM、NeRF、3D生成等)与大模型的深度融合,实现端到端的具身智能决策; 4、与机器人平台、仿真系统、产品团队紧密协作,推动算法在真实硬件或虚拟环境中的部署与验证; 5、跟踪并引领国际前沿进展,在顶级会议(如 NeurIPS, ICML, CVPR, ICLR, RSS, CoRL 等)发表高水平成果,构建技术壁垒。

更新于 2026-02-02北京
logo of amap
社招2年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2026-02-11北京