
商汤具身-数据运营总监
任职要求
1、8年以上数据采集运营相关经验,5年以上团队管理经验,有数采场或数采项目高级管理背景优先; 2、必须具备具身智能/机器人等领域的数据采集运营实战经验,熟悉人形机器人场景…
工作职责
1、负责设计并落地端到端的具身智能数据采集运营体系,覆盖任务管理、采集执行、数据清洗、质量管控、标注管理等全链路流程及相应的标准与规范,制定数据运营中长期战略; 2、组建并管理数据运营团队,对数据采集的交付负责,并搭建数据运营的核心指标体系,协调业务、软件、硬件等跨部门需求,保障数据交付的及时性与准确性,驱动业务持续优化; 3、持续进行流程优化、工具提效与资源整合,通过自动化水平提升实现规模化降本;
1、与顶尖算法团队紧密协作,深入理解VLA模型训练方法,负责具身智能数据采集、清洗、标注、评估生产管理全流程,包括视觉、敏锐度、运动等多模态数据,提供数据支持和建议; 2、定义并规划数据采集、标注标准与高效执行流程,主导采标平台设计和优化,确保数据处理的高效性和稳定性; 3、引入主动学习、自动标注、仿真数据合成等技术手段,大幅提升数据采集标注效率与数据价值密度,为模型训练提供高质量数据支撑。
1. 质量管理体系建设:制定具身智能数据采集业务的审核标准与流程,确保数据质量符合模型训练要求。 2. 外包团队管理:统筹外包数据审核员团队,分配任务、跟踪进度,进行绩效评估与优化。 3. 审核进度把控:监控数据审核效率,协调资源解决瓶颈,确保项目按时完成。 4. 质量异常处理:识别并处理数据质量问题,推动改进措施,降低错误率。 5. 跨部门协作:与算法、采集团队沟通需求,反馈质量报告,优化数据生产全链路。

【岗位职责】 1. 数据平台产品规划 • 负责ACE具身数据平台的整体产品规划与路线图制定,覆盖数据采集、标注、清洗、合成、版本管理、训练数据输出全流程。 • 深入理解具身智能大模型(VLA/世界模型)的数据需求,设计面向SFT、RL、模仿学习等场景的数据生产管线。 • 定义平台核心能力,包括采集任务管理、多模态标注、质量评估、数据资产目录等。 2. 数据流水线建设 • 构建高效、可追溯的数据流水线,支持真机采集、仿真合成、互联网多模态数据的统一接入与处理。 • 建立数据版本管理与血缘追踪机制,确保从采集到训练的全链路数据可复现。 3. 标注工具与质量体系 • 主导标注平台设计(含预标注、人机协同、质检等),提升标注效率与数据质量。 • 探索基于AI Agent的智能标注方案,降低人工成本。 • 建立供应商管理、专家标注员培训与质量评估体系。 4. 数据闭环与飞轮建设 • 推动“数据-模型-标注”自动化迭代闭环,利用模型反馈优化数据采集与标注策略。 • 建立平台核心指标体系(吞吐量、标注效率、模型增益等),以数据驱动产品迭代。 5. 跨团队协同 • 与算法、研发、采集团队紧密协作,协调内外部标注与采集资源,建立稳定的数据供应链。

1. 具身智能数据采集运营管理:负责制定和执行数据采集中心的日常运营计划、标准作业程序(SOP)与管理制度。统筹协调各类数据采集任务(如:机器人导航、操作、交互等场景的多模态数据),确保任务按时、按质、按量完成。监控数据采集的全流程,包括场景搭建、设备调度、人员安排、数据录制、数据上传与备份,及时发现并解决运营中的问题。 持续优化数据采集流程,提升采集效率和资源利用率。 2. 设备与场景管理:负责数据采集中心所有硬件设备(如:机器人平台、传感器、相机、穿戴设备等)的日常维护、校准、台账管理及生命周期管理。规划和监督采集场景(如:模拟家庭、办公室、仓库、户外等)的搭建、维护与更新,确保场景的安全性与多样性符合研发需求。 3. 团队管理:管理数据采集工程师、操作员、标注员等团队,包括任务分配、绩效评估、技能培训与团队建设。制定并执行数据采集规范与质量标准的培训计划,确保团队成员熟练掌握操作技能与安全知识。 4. 项目协作与沟通:作为数据采集接口人,与技术团队(算法、工程)紧密协作,深入理解数据需求,并将其转化为可执行的采集方案。