小米具身算法工程师/专家
任职要求
1、机器人、计算机、人工智能等相关领域硕士及以上学历,有大模型在机器人领域应用经验者优先; 2、掌握模仿学习,强化学习等机器学习领域的基础理论和经典算法,熟悉Pytorch或TensorFlow等深度学习框架; 3、熟悉多模态大模型的训练流程,包括数据预处理、预训练、模型调优和验证等,了解常见的增量训练方法与大模型微调方法,有Octo,OpenVLA,GR-2等机器人VLA模型训练部署经验者优先; 4、熟悉Mujoco、Isaac Lab等机器人仿真平台以及ROS框架,扎实的C++或Python编程能力; 5、具有较强的自主学习与研究能力,能够独立解决复杂问题;
工作职责
1、负责机器人多模态大模型的开发,提升机器人对物理世界和人类语言的理解能力,以解决通用场景下的多任务操作问题; 2、优化模型框架和算法组件,利用视觉,语音,本体感知等多模态信息实现在不同应用场景下的功能泛化和长序列动作; 3、深度参与数据构建、模型训练和评测部署,支持模型算法在机器人控制系统中的集成,确保算法的实时性和稳定性; 4、结合生成式AI与多模态技术,探索机器人世界模型在实际场景的落地与应用潜力;
1、研发基于人形机器人平台(轮式、足式)的通用型具身算法,实现在开放世界中自主导航移动、物理交互与操纵任务; 2、研发基于多模态具身大模型、扩散模型等前沿AI技术的多模态(视觉、语言)交互能力,以及机器人行为的智能决策与规划;
研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。
高德地图定位研发团队介绍: “我在哪儿,要到哪儿去”是高德给全国亿级用户解决的核心问题, 我们系统解决“我在哪儿”的问题, 我们使用遍布全球的北斗卫星数据,高密度的手机传感器数据,视觉数据, 我们建设世界级的高精准定位系统, 驾车定位、车道级定位、室内定位、停车场定位、车机定位等 是我们核心解决的业务场景。 我们攻克着大量的世界级前沿技术难题: 基于时间序列预测的统一融合定位算法、 基于Transformer的统一融合匹配算法、 基于BEV、slam等的视觉定位算法 ...... 为了给广大用户的出行提供全方位、高质量的服务,我们正在不停地打破自己、超越自己...... 在这里,无数行业前沿的新技术在碰撞交流和应用, 这就是高德地图定位研发部 期待勇于突破,勇于挑战的你! 岗位职责: 1、多模态大模型研发与应用:将定位问题转化为大模型问题,用大模型的思路对时空数据进行建模、训练(包括但不限于预训练、SFT、强化学习等)等,实现轨迹预测和轨迹匹配; 2. 模型优化与小型化部署:负责多模态大模型的轻量化设计、压缩与加速,确保模型在端侧设备上的高效运行; 3、创新探索:跟进位置和地图领域的大模型前沿进展,应用在日常工作中。