logo of antgroup

蚂蚁金服蚂蚁集团-具身智能数据工程师-上海

社招全职3年以上技术类-数据地点:上海状态:招聘

任职要求


学历】
   计算机科学、软件工程、数据科学或相关专业本科及以上学历。

【技术技能】
1. 熟悉大数据处理技术及工具(如 HadoopSpark 等)。
2. 了解数据仓库设计和 Schema 设计。
3. 熟悉 Linux 环境,有一定的系统运维和脚本开发经验。

【经验与能力】
1. 2年以上自动驾驶或具身智能行业数据相关工作经验。
2. 有数据质量管理、监控和故障排查的能力。
3. 对分布式系统、数据并行处理和性能优化有深刻理解。
4. 沟通协作能力:能够与跨部门团队高效沟通,具备独立思考能力,能够解决复杂的技术问题。

【加分项】
数据安全和合规相关的项目经验。

工作职责


1. 数据采集与质量管控:
- 设计并实施面向具身机器人的多模态数据采集方案,覆盖 传感器数据(摄像头、激光雷达、关节数据)、交互行为数据及环境语义信息。
- 制定 数据质量评估体系(如标注准确率、场景覆盖率、分布均衡性),通过自动化校验(规则引擎、异常检测)和人工抽样审核保障数据有效性。
- 与算法团队深度协作,将模型需求(如长尾场景挖掘、多模态对齐)转化为可执行的采集策略(如场景布置、合成数据生成)。
2. 数据链路开发与优化:构建高效的数据流水线,支持大规模数据存储、传输和实时处理。
3. 数据标注与增强:与标注团队合作,制定数据标注规范,确保标注一致性。
4. 支持算法研发:为具身智能算法团队提供高质量数据集,支持强化学习、模仿学习、感知与控制等方向的研究。
5. 跨团队协作:与硬件团队、软件团队及算法团队紧密合作,确保数据流与系统架构无缝集成。
包括英文材料
学历+
数据科学+
Hadoop+
Spark+
数据仓库+
Linux+
脚本+
自动驾驶+
分布式系统+
相关职位

logo of antgroup
社招3年以上技术类-数据

核心使命:构建下一代具身智能数据交互平台,通过高性能Web 可视化技术,赋能算法研发、数据闭环与仿真验证。 1. 多模态数据可视化引擎开发 - 统计分析可视化:开发数据看板,支持对海量机器人数据(任务日志、状态指标、标注结果)的聚合、筛选、图表展示(时序曲线、热力图、分布图等)。 - 实时回放与交互可视化:构建类播放器的交互界面,支持传感器数据(视频流、点云、IMU)及机器人状态(关节角度/轨迹)的逐帧回放、拖拽跳转、多流同步。 2. 数据工具链前端实现 - 可视化标注平台:开发交互式标注工具(如2D/3D 框体标注、轨迹标注、语义标注),支持视频、点云等多模态数据的联合标注,并与后端标注存储系统集成。 - 数据查询与检索系统:实现灵活的数据查询界面(如按时间范围、任务ID、传感器类型过滤),支持数据样本的实时预览与导出。 - 仿真过程可视化:对接仿真引擎,实时渲染机器人动作、环境状态及任务执行过程,支持调试与结果分析。 3. 实时数据流处理与通信 - 构建低延迟数据通信层:使用WebSocket/WebRTC 实现传感器数据流的实时传输与播放控制。 - 设计时间轴同步机制:确保多传感器数据(视频、激光雷达、关节状态)在回放时严格对齐,支持全局时间戳控制。 4. 跨职能协作 - 与后端工程师紧密合作,定义数据接口格式、通信协议及性能优化点。 - 与算法/数据工程师协作,理解数据语义与业务需求,设计直观的数据交互流程。 - 与仿真团队对接,实现仿真结果的可视化验证。

更新于 2025-08-14
logo of xpeng
社招智能机器人板块

岗位亮点 - 参与最前沿的具身智能研究,推动人形机器人和智能体的发展; - 负责大规模多模态数据的采集与处理,直接影响机器人学习与泛化能力; - 跨学科合作机会,接触算法、硬件与系统全栈。 - 主导机器人多模态数据的采集和处理,涵盖文本、图像、视频、音频、动作等,让机器人“学会看、听、说、动”; - 搭建高效的数据处理 Pipeline,从海量原始数据中“炼金”,让它们转化为可直接驱动模型训练的高质量数据; - 打造和优化数据平台的核心模块(处理、标注、对齐、存储、可视化),确保每一份数据都可追溯、可验证; - 与算法团队并肩作战,理解模型对数据的敏感点,快速迭代采集策略,让机器人学得更快、更聪明; - 紧跟全球前沿,研究并引入最新的数据集与标准,把优秀的开源经验转化为我们的优势资产,持续扩充数据版图。

更新于 2025-08-26
logo of sensetime
社招算法工程

1. VLA模型研发: 参与或主导 VLA 模型的架构设计、训练和优化,提升模型在多模态理解和具身任务执行中的性能。 2. 数据闭环建设: 负责具身智能所需的数据采集、标注和处理流程,构建高效的数据闭环系统,以持续优化模型。你将探索新的数据获取方式,包括但不限于利用机器人自身进行自动化数据采集。 3. 具身技能开发: 将 VLA 模型部署到实际机器人平台上,解决模型与机器人硬件之间的集成和适配问题。开发和调试机器人技能,使其能够完成抓取、放置、操作工具等复杂任务。 4. 算法优化与落地: 持续关注具身智能领域的最新研究成果,并将前沿算法应用到实际产品中,解决技术挑战,推动产品性能的迭代升级。

更新于 2025-09-26
logo of sensetime
校招算法研究类

1. VLA模型研发: 参与或主导 VLA 模型的架构设计、训练和优化,提升模型在多模态理解和具身任务执行中的性能。 2. 数据闭环建设: 负责具身智能所需的数据采集、标注和处理流程,构建高效的数据闭环系统,以持续优化模型。你将探索新的数据获取方式,包括但不限于利用机器人自身进行自动化数据采集。 3. 具身技能开发: 将 VLA 模型部署到实际机器人平台上,解决模型与机器人硬件之间的集成和适配问题。开发和调试机器人技能,使其能够完成抓取、放置、操作工具等复杂任务。 4. 算法优化与落地: 持续关注具身智能领域的最新研究成果,并将前沿算法应用到实际产品中,解决技术挑战,推动产品性能的迭代升级。

更新于 2025-09-28