logo of bytedance

字节跳动具身智能大模型负责人-Seed

社招全职5年以上A223037地点:北京状态:招聘

任职要求


1、计算机科学、人工智能、数学、机器人学等相关专业,博士学位优先,5年左右大模型相关工作经验;
2、熟悉机器人学、强化学习、多模态融合(VLA)等技术,强烈的学术敏感度与工程化思维,能独立…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、主导具身智能大模型的核心算法研发,包括多模态感知(视觉、语言、动作)、强化学习策略优化、世界模型构建等方向;
2、研究传统仿真与生成式仿真相结合的数据合成方案,构建机器人及具身智能领域的新型数据范式,推动合成数据在训练与真实场景中的应用;
3、跟踪学术界与工业界最新进展(如VLA、具身智能等),保持技术领先性快速验证关键技术并推动团队技术迭代;
4、推动模型在机器人场景的落地,解决实际应用中的挑战。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of bytedance
社招A15783

1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-16北京
logo of bytedance
社招3年以上A00928

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。 Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。 1、数据生产管理统筹:World Model训练数据的全生命周期管理,涵盖数据需求分析、采集规范制定、质量审核、版本管理及上线交付,确保数据供给的规模、多样性与一致性满足模型迭代要求; 2、合成产线搭建:主导自动化数据合成产线的设计与落地,利用游戏引擎(如Unreal Engine/Unity)或仿真平台(如Isaac Sim/CARLA)构建可程序化驱动的场景生成、渲染与标注流水线,大幅降低人工数据采集成本; 3、工作流设计:负责端到端数据工作流的梳理与标准化,包括标注任务分发、众包质检、人机协同审核等关键节点的流程设计,输出可复用的SOP并落地到工具平台中; 4、数据质量体系:建立面向World Model的数据质量评估框架,定义时序一致性、物理合理性、多模态对齐等核心质量维度的量化指标,并推动质检工具的自动化落地; 5、跨团队协同:深度对接算法研发团队,理解模型训练对数据分布、格式与规模的动态需求,快速响应并调整产线配置;同时协调外部供应商、外包团队及开源社区资源,保障数据交付节奏; 6、效率与规模优化:持续追踪产线瓶颈,推动渲染调度、标注自动化、数据清洗等环节的工程优化,建立数据产出效率与质量的双向监控体系,支撑产线从百万级向十亿级规模的扩展。

更新于 2026-03-30北京
logo of xpeng
校招

打造行业领先的原生具身智能大模型,如VLM/VLA/World Model/Omni。面向通用人形机器人及更广泛的具身场景,构建可泛化、可拓展、可scaling的大模型,负责大规模训练性能与效果优化。 职位要求: 1、计算机、电子工程、人工智能等相关领域硕士及以上学历; 2、具有扎实的机器学习算法基础,在VLM、LLM、AIGC、RL、Robotics、Audio 等相关专业领域有研究经验; 3、具有优秀的代码能力,精通PyTorch/TensorFlow等深度学习框架,熟悉大规模训练栈:大规模训练框架,加速方法; 4、具有良好的团队合作能力和沟通能力。

更新于 2025-10-30深圳|上海|北京
logo of xpeng
实习

我们致力于前沿机器人交互技术的研发,目标是打造能够精准理解人类意图、实现自然流畅人机协作的下一代机器人系统。在这里,您将有机会将最先进的计算机视觉与多模态大模型技术应用于真实的机器人场景,解决极具挑战性的问题,并见证您的算法如何改变人机交互的未来。 负责机器人交互中的核心意图识别算法的研发与迭代,技术方向包括但不限于:目标检测、多目标跟踪、人体/人脸关键点检测、手势识别、行为理解等。 探索并推动多模态大模型在机器人交互场景下的应用与落地,实现基于视觉、语音等多模态信息的深度意图理解。 负责将算法模型进行高效的优化、部署和集成,确保其在真实机器人平台上的性能和稳定性。 持续跟踪计算机视觉、多模态学习、机器人学等领域的最新学术进展,并将有潜力的技术转化为实际生产力。

更新于 2025-09-26深圳