小米具身智能数据算法工程师
任职要求
1. 硕士及以上学历,计算机/自动化专业,具备机器人遥操作、机器人系统、自动驾驶数据算法经验优先。 2. 熟悉ROS 2框架,有机器人、自动驾驶(仿真或实体)系统调优经验优先,参与过机器人大模型系统建设优先。 3. 熟悉机器人运动学、动力学基…
工作职责
1. 利用云端视觉专业小模型或多模态大模型,对原始视频、图像等数据进行自动预标注,如物体检测、分割、姿态估计、动作标签生成等。 2. 研发算法,解决多源数据的对齐、标准化与融合问题,实现数据本体动作到机器人关节信息的实时动态映射。 3. 设计针对大模型自动标注结果的人机协同质检、清洗与修正流程,确保标注真值的可靠性。并开发自动化数据质量评估体系,持续监控和提升数据集的效用。 4. 构建高效的自动化数据标注等管线以及相应的数据策略,支持TB级多模态数据分析以及性能评估。 5. 联合数据平台团队,构建高效的数据管理、回放、质检等平台流程; 6. 开发面向机器人的遥操作技术和系统,利用VR、动捕服等手段,实现机械臂/人形机器人的动作实时映射与控制。
核心使命:构建下一代具身智能数据交互平台,通过高性能Web 可视化技术,赋能算法研发、数据闭环与仿真验证。 1. 多模态数据可视化引擎开发 - 统计分析可视化:开发数据看板,支持对海量机器人数据(任务日志、状态指标、标注结果)的聚合、筛选、图表展示(时序曲线、热力图、分布图等)。 - 实时回放与交互可视化:构建类播放器的交互界面,支持传感器数据(视频流、点云、IMU)及机器人状态(关节角度/轨迹)的逐帧回放、拖拽跳转、多流同步。 2. 数据工具链前端实现 - 可视化标注平台:开发交互式标注工具(如2D/3D 框体标注、轨迹标注、语义标注),支持视频、点云等多模态数据的联合标注,并与后端标注存储系统集成。 - 数据查询与检索系统:实现灵活的数据查询界面(如按时间范围、任务ID、传感器类型过滤),支持数据样本的实时预览与导出。 - 仿真过程可视化:对接仿真引擎,实时渲染机器人动作、环境状态及任务执行过程,支持调试与结果分析。 3. 实时数据流处理与通信 - 构建低延迟数据通信层:使用WebSocket/WebRTC 实现传感器数据流的实时传输与播放控制。 - 设计时间轴同步机制:确保多传感器数据(视频、激光雷达、关节状态)在回放时严格对齐,支持全局时间戳控制。 4. 跨职能协作 - 与后端工程师紧密合作,定义数据接口格式、通信协议及性能优化点。 - 与算法/数据工程师协作,理解数据语义与业务需求,设计直观的数据交互流程。 - 与仿真团队对接,实现仿真结果的可视化验证。
负责具身智能数据平台的前端系统建设,打造面向算法工程师、数据工程师的统一工作台,支撑数据可视化、数据理解、数据操作与多模态数据标注等核心能力 1. 负责数据平台前端整体架构设计与功能实现,支撑复杂数据与任务流程的可视化与交互 2. 实现多模态数据的可视化展示能力,包括图像、视频、点云、轨迹与传感器数据 3. 与后端与算法团队协作,推动半自动标注、智能辅助标注等能力的前端落地 4. 持续优化前端性能、交互体验与工程质量
1. 推进机器人多模态大模型(VLM/VLA)的工程化落地:涵盖预训练、微调、训练加速和效果调优; 2. 基于issac sim搭建仿真环境验证操作模型,设计real2sim2real迁移框架,加速算法验证与落地; 3. 具身智能算法研发,包括不同数据配比/网络结构/本体构型,在toC场景完成长序列任务和技能泛化; 4. 研发自动化标注算法(2D/3D/VLA等),降低标注成本和提升标注质量; 5. 设计多模态数据(图像、视频和点云等)生成算法,增强数据多样性。