logo of xpeng

小鹏汽车机器人多模态数据工程师

社招全职智能机器人板块地点:深圳 | 上海状态:招聘

任职要求


- 硕士及以上学历,计算机科学、数据工程、机器人或相关背景;
- 有处理过大规模、多模态数据的经验,熟悉机器人或自动驾驶数据集(如 DROID、OpenX-Embodiment);
- 精通 Python,熟悉 PyTorch,具备扎实的工程能力和良好的代码习惯;
- 有机器人系统经验(特别是人形机器人)者加分,你的工作将能立刻落地到真实机器人体内;
- 思维开放,善于沟通,能与算法、硬件、系统团队高效协作,把数据的价值最大化;
- 对前沿技术保持好奇心与热情,愿意在具身智能领域迎接挑战、突破边界。

工作职责


岗位亮点
- 参与最前沿的具身智能研究,推动人形机器人和智能体的发展;
- 负责大规模多模态数据的采集与处理,直接影响机器人学习与泛化能力;
- 跨学科合作机会,接触算法、硬件与系统全栈。


- 主导机器人多模态数据的采集和处理,涵盖文本、图像、视频、音频、动作等,让机器人“学会看、听、说、动”;
- 搭建高效的数据处理 Pipeline,从海量原始数据中“炼金”,让它们转化为可直接驱动模型训练的高质量数据;
- 打造和优化数据平台的核心模块(处理、标注、对齐、存储、可视化),确保每一份数据都可追溯、可验证;
- 与算法团队并肩作战,理解模型对数据的敏感点,快速迭代采集策略,让机器人学得更快、更聪明;
- 紧跟全球前沿,研究并引入最新的数据集与标准,把优秀的开源经验转化为我们的优势资产,持续扩充数据版图。
包括英文材料
学历+
自动驾驶+
Python+
PyTorch+
算法+
相关职位

logo of anker
校招

1.推进机器人多模态大模型(VLM/VLA)、3D感知算法的工程化落地:涵盖预训练、微调、训练加速和效果调优。 2.基于issac sim搭建仿真环境验证操作模型,设计real2sim2real迁移框架,加速算法验证与落地。 3.具身智能算法研发,包括不同数据配比/网络结构/本体构型,在toC场景完成长序列任务和技能泛化。 4.研发自动化标注算法(2D/3D/VLA等),降低标注成本和提升标注质量。 5.设计多模态数据(图像、视频和点云等)生成算法,增强数据多样性。

更新于 2025-05-16
logo of anker
校招

1. 推进机器人多模态大模型(VLM/VLA)的工程化落地:涵盖预训练、微调、训练加速和效果调优; 2. 基于issac sim搭建仿真环境验证操作模型,设计real2sim2real迁移框架,加速算法验证与落地; 3. 具身智能算法研发,包括不同数据配比/网络结构/本体构型,在toC场景完成长序列任务和技能泛化; 4. 研发自动化标注算法(2D/3D/VLA等),降低标注成本和提升标注质量; 5. 设计多模态数据(图像、视频和点云等)生成算法,增强数据多样性。

更新于 2025-08-14
logo of antgroup
社招3年以上技术类-数据

1. 数据采集与质量管控: - 设计并实施面向具身机器人的多模态数据采集方案,覆盖 传感器数据(摄像头、激光雷达、关节数据)、交互行为数据及环境语义信息。 - 制定 数据质量评估体系(如标注准确率、场景覆盖率、分布均衡性),通过自动化校验(规则引擎、异常检测)和人工抽样审核保障数据有效性。 - 与算法团队深度协作,将模型需求(如长尾场景挖掘、多模态对齐)转化为可执行的采集策略(如场景布置、合成数据生成)。 2. 数据链路开发与优化:构建高效的数据流水线,支持大规模数据存储、传输和实时处理。 3. 数据标注与增强:与标注团队合作,制定数据标注规范,确保标注一致性。 4. 支持算法研发:为具身智能算法团队提供高质量数据集,支持强化学习、模仿学习、感知与控制等方向的研究。 5. 跨团队协作:与硬件团队、软件团队及算法团队紧密合作,确保数据流与系统架构无缝集成。

更新于 2025-09-29
logo of antgroup
社招3年以上技术类-数据

1. 多模态数据接入与实时处理: - 设计、开发与维护高效、稳定、可扩展的数据接入服务,负责摄传感器数据、机器人状态数据、任务层抽象数据等多维态异构数据的实时采集、解析与初步处理。 2. 数据管道与平台核心开发: - 开发支持从机器人端到云/边缘数据中心的数据传输链路,并支持将训练好的模型部署反馈数据回流至数据平台。 - 设计、实现和优化大规模机器人数据的存储、传输、批处理与流处理的数据管道。 - 构建和维护核心数据平台基础设施,包括数据湖/仓、消息队列、流处理引擎、任务调度系统等 - 开发自动化工具和框架,提升数据管道的开发效率、部署速度、监控能力和运维可靠性。 - 确保数据流能无缝支持模型训练、仿真验证、在线评估等环节的数据供给与结果回流。 3. 数据平台工具链支持: - 为下游的数据标注、数据挖掘分析、模型训练等环节提供稳定、高效的数据访问接口和服务。 - 与算法团队协作,理解其对数据流的需求(如数据格式、频率、查询要求),并提供技术支持。

更新于 2025-09-28