字节跳动大模型数据运营专家(VLA方向)-大模型数据服务中心
任职要求
1、硕士及以上学位,机器人学、人工智能、机械电子工程、自动化等相关专业优先,具备良好的沟通协作能力;
2、对主流具身模型训练以及部署有良好的经验优先,有过智驾、具身智能、VLM等经验优先;思维灵活,擅长从技术、产品、用户多维度探索问题解决方案,具备较强的试错迭代与总结能力;
3、具备敏锐的技术洞…工作职责
1、与顶尖算法团队紧密协作,深入理解VLA模型训练方法,负责具身智能数据采集、清洗、标注、评估生产管理全流程,包括视觉、敏锐度、运动等多模态数据,提供数据支持和建议; 2、定义并规划数据采集、标注标准与高效执行流程,主导采标平台设计和优化,确保数据处理的高效性和稳定性; 3、引入主动学习、自动标注、仿真数据合成等技术手段,大幅提升数据采集标注效率与数据价值密度,为模型训练提供高质量数据支撑。
1.技术与系统架构:负责具身智能与机器人系统的整体架构设计,并主导机器人平台化(硬件模块、控制栈、感知栈)与大模型平台化(数据、训练、推理)的统一设计。 2.具身智能大模型工程:建设数据体系,协同科研模型算法团队推进具身大模型训练,协同、调用云平台搭建面向具身场景的大规模训练与分布式基础设施。 3.端侧模型推理部署:负责将具身智能模型在机器人端侧部署,并结合机器人计算资源进行软硬件协同优化。 4.机器人系统落地与工程交付:主导机器人在各类场景的落地与项目交付;负责从需求拆解、系统集成、工程实现、测试验证到交付运营的全流程工程管理;协调与供应链、ODM/OEM、硬件厂商的技术对接,以及机器人产业上下游的合作。 5.团队管理与跨部门协作:管理多学科工程团队,建立工程和研发流程(CI/CD、QA、仿真体系、回归测试、可靠性验证),并与产品、科研、算法、行业解决方案和 BD 团队紧密协作推进关键项目落地。

1.技术与系统架构:负责具身智能与机器人系统的整体架构设计,并主导机器人平台化(硬件模块、控制栈、感知栈)与大模型平台化(数据、训练、推理)的统一设计。 2.具身智能大模型工程:建设数据体系,协同科研模型算法团队推进具身大模型训练,协同、调用云平台搭建面向具身场景的大规模训练与分布式基础设施。 3.端侧模型推理部署:负责将具身智能模型在机器人端侧部署,并结合机器人计算资源进行软硬件协同优化。 4.机器人系统落地与工程交付:主导机器人在各类场景的落地与项目交付;负责从需求拆解、系统集成、工程实现、测试验证到交付运营的全流程工程管理;协调与供应链、ODM/OEM、硬件厂商的技术对接,以及机器人产业上下游的合作。 5.团队管理与跨部门协作:管理多学科工程团队,建立工程和研发流程(CI/CD、QA、仿真体系、回归测试、可靠性验证),并与产品、科研、算法、行业解决方案和 BD 团队紧密协作推进关键项目落地。
1.数据策略与规划:负责文本和多模态大模型训练数据(包括预训练和后训练)的数据建设统筹规划,包括数据调研、数据引入、数据质量标准制定、数据验收等。 2.渠道管理:管理相关数据渠道,通过合作引入相关数据。 3.数据创新:探索新的数据来源(如开源数据、合成数据、用户反馈数据),提升数据规模和质量。