小米具身智能数据算法工程师
任职要求
1. 硕士及以上学历,计算机/自动化专业,具备机器人遥操作、机器人系统、自动驾驶数据算法经验优先。 2. 熟悉ROS 2框架,有机器人、自动驾驶(仿真或实体)系统调优经验优先,参与过机器人大模型系统建设优先。 3. 熟悉机器人运动学、动力学基…
工作职责
1. 利用云端视觉专业小模型或多模态大模型,对原始视频、图像等数据进行自动预标注,如物体检测、分割、姿态估计、动作标签生成等。 2. 研发算法,解决多源数据的对齐、标准化与融合问题,实现数据本体动作到机器人关节信息的实时动态映射。 3. 设计针对大模型自动标注结果的人机协同质检、清洗与修正流程,确保标注真值的可靠性。并开发自动化数据质量评估体系,持续监控和提升数据集的效用。 4. 构建高效的自动化数据标注等管线以及相应的数据策略,支持TB级多模态数据分析以及性能评估。 5. 联合数据平台团队,构建高效的数据管理、回放、质检等平台流程; 6. 开发面向机器人的遥操作技术和系统,利用VR、动捕服等手段,实现机械臂/人形机器人的动作实时映射与控制。
1. 负责具身智能数据平台的搭建与开发,构建覆盖采集、处理、标注、质检全链路的自动化数据管线,支撑大规模机器人学习数据的高效生产; 2. 研发基于三维重建的场景与物体数字化技术(如 NeRF、3D Gaussian Splatting、MVS 等),构建高保真三维资产库,为仿真环境与合成数据生成提供基础数据支撑; 3. 开发人体与手部运动建模系统,涵盖全身动作捕捉、灵巧手姿态估计、人手-物体交互重建等,将人类示范数据高效转化为机器人可用的训练数据; 4. 设计并实现自动化/半自动化标注系统,结合视觉基础模型(SAM、GroundingDINO 等)与主动学习策略,实现操作任务中关键语义信息(动作分割、接触检测、物体状态等)的高效标注; 5. 搭建多模态数据采集系统,集成多视角相机、深度传感器、力/触觉传感器、动捕设备等,设计标准化采集流程,保障数据质量与一致性; 6. 建立数据质量评估与治理体系,开发数据清洗、去重、平衡、增强等工具,构建面向机器人操作任务的高质量 benchmark 数据集; 7. 与算法团队紧密协作,根据模型训练需求(VLA、World Model、RL 等)定义数据规格,推动数据驱动的算法迭代闭环。
核心使命:构建下一代具身智能数据交互平台,通过高性能Web 可视化技术,赋能算法研发、数据闭环与仿真验证。 1. 多模态数据可视化引擎开发 - 统计分析可视化:开发数据看板,支持对海量机器人数据(任务日志、状态指标、标注结果)的聚合、筛选、图表展示(时序曲线、热力图、分布图等)。 - 实时回放与交互可视化:构建类播放器的交互界面,支持传感器数据(视频流、点云、IMU)及机器人状态(关节角度/轨迹)的逐帧回放、拖拽跳转、多流同步。 2. 数据工具链前端实现 - 可视化标注平台:开发交互式标注工具(如2D/3D 框体标注、轨迹标注、语义标注),支持视频、点云等多模态数据的联合标注,并与后端标注存储系统集成。 - 数据查询与检索系统:实现灵活的数据查询界面(如按时间范围、任务ID、传感器类型过滤),支持数据样本的实时预览与导出。 - 仿真过程可视化:对接仿真引擎,实时渲染机器人动作、环境状态及任务执行过程,支持调试与结果分析。 3. 实时数据流处理与通信 - 构建低延迟数据通信层:使用WebSocket/WebRTC 实现传感器数据流的实时传输与播放控制。 - 设计时间轴同步机制:确保多传感器数据(视频、激光雷达、关节状态)在回放时严格对齐,支持全局时间戳控制。 4. 跨职能协作 - 与后端工程师紧密合作,定义数据接口格式、通信协议及性能优化点。 - 与算法/数据工程师协作,理解数据语义与业务需求,设计直观的数据交互流程。 - 与仿真团队对接,实现仿真结果的可视化验证。
负责具身智能数据平台的前端系统建设,打造面向算法工程师、数据工程师的统一工作台,支撑数据可视化、数据理解、数据操作与多模态数据标注等核心能力 1. 负责数据平台前端整体架构设计与功能实现,支撑复杂数据与任务流程的可视化与交互 2. 实现多模态数据的可视化展示能力,包括图像、视频、点云、轨迹与传感器数据 3. 与后端与算法团队协作,推动半自动标注、智能辅助标注等能力的前端落地 4. 持续优化前端性能、交互体验与工程质量