logo of mi

小米顶尖应届-具身大模型数据工程师-XiaomiRobotics

校招全职地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机、人工智能、自动化、数据科学等相关专业,有多模态数据处理、具身数据、机器人数据或自动驾驶数据工程经验者优先。 
2、熟悉大模型训练数据全流程,理解预训练、SFT、强化学习等阶段的数据特点及组织方式。 
3、熟练掌握Python,熟悉分布式数据…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责具身大模型多模态数据体系建设,覆盖图像、视频、语言、图文交错、动作轨迹、机器人交互等数据类型,支撑模型训练、评测与迭代。 
2、设计并搭建大规模数据处理与生产管线,包括数据采集、清洗、标注、筛选、标准化、混合配比、质量评估与版本管理,保障数据全生命周期高效运转。 
3、面向预训练、持续训练、SFT、强化学习等不同阶段,制定适配的数据策略与处理方案,提升数据利用效率与训练效果。 
4、针对多模态具身大模型任务特点,解决跨模态对齐、时序一致性、动作标注、数据稀疏性与分布不均衡等问题,持续优化数据质量。 
5、联合数据平台、模型与机器人团队,建设自动化数据回放、质检、追溯与评测体系,形成可复用、可迭代的数据基础设施。 
6、跟踪多模态数据处理、自动标注与数据质量评估等方向的前沿技术,推动数据体系持续升级。
包括英文材料
学历+
数据科学+
自动驾驶+
还有更多 •••
相关职位

logo of mi
校招

1、负责具身大模型训练与推理基础设施的架构设计、搭建与优化,支撑大规模预训练、持续训练、强化学习及在线/离线推理任务稳定高效运行。 2、基于Megatron-LM、DeepSpeed、FSDP等分布式训练框架,设计并优化数据并行、张量并行、流水并行、专家并行等策略,支撑大参数量多模态模型训练。 3、深耕大模型训练性能优化,包括显存占用、算力利用率、通信效率、checkpoint与断点续训、训练稳定性等关键问题,提升训练吞吐与资源效率。 4、负责推理系统优化与部署,覆盖自回归模型、Diffusion模型及MoE模型等典型架构,提升推理链路在吞吐、延迟、显存占用和稳定性方面的综合表现。 5、推动量化、算子融合、图优化、显存复用、服务化部署等推理加速技术落地,支撑具身大模型在云端或端上环境的部署。 6、与算法、数据、平台团队紧密协作,完善训练配置、日志监控、指标可视化、故障定位等工具链,提升研发效率与工程标准化水平。

更新于 2026-04-03北京
logo of mi
校招

1. 参与研究与开发融合视觉与语言理解的端到端机器人新范式; 2. 负责视觉语言大模型(VLA)相关算法的设计、实现与优化,提升模型的环境感知、决策规划能力; 3. 探索如何利用VLA增强机器人的泛化能力及人机交互的自然性; 4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试。 5.跟踪VLA及相关领域(多模态学习、大模型等)的前沿技术动态。 6. 发表高水平论文至国际顶会顶刊,参加相关领域的国内外顶级学术会议。 【课题名称】 具身基座VLA大模型预研 【课题内容】 探索如何利用VLA与Foundation Model技术提升机器人的环境理解、任务规划与泛化执行能力,构建面向未来的通用智能体。

更新于 2025-06-26北京
logo of mi
校招

1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。

更新于 2025-06-23北京
logo of mi
校招

1. 负责3C智能制造领域的前沿算法研究; 2. 设计并实现创新的AI解决方案; 3. 与产品团队紧密合作,将研究成果转化为实际应用; 4. 撰写技术专利和学术论文; 5. 参与行业技术交流,跟踪最新技术发展。 【课题名称】 3C智能制造工业算法研究 【课题内容】 1. 机器学习与深度学习:重点研究工艺参数调优、设备预测性维护、生产质量预测与控制以及智能调度优化等关键技术,通过深度学习技术提升制造过程的智能化水平和效率; 2. 大模型应用:探索工业知识库构建、多模态工业数据理解、工业决策支持系统等前沿领域,利用大模型技术赋能工业智能化升级; 3. 具身智能:研究工业装备智能控制、自适应制造系统、人机协作系统等方向,推动智能装备向更高水平的自主化和智能化发展。

更新于 2025-06-25北京