logo of bytedance

字节跳动具身智能大模型负责人-Seed

社招全职5年以上A223037地点:北京状态:招聘

任职要求


1、计算机科学、人工智能、数学、机器人学等相关专业,博士学位优先,5年左右大模型相关工作经验;
2、熟悉机器人学、强化学习、多模态融合(VLA)等技术,强烈的学术敏感度与工程化思维,能独立领导技术攻关并推动团队协作;
3、对具身智能、通用机器人等方向有浓厚兴趣,具备优秀的逻辑表达与跨团队沟通能力;
4、在顶会(CVPRICLR、ICRA等)发表过相关论文,或主导过开源项目。

工作职责


1、主导具身智能大模型的核心算法研发,包括多模态感知(视觉、语言、动作)、强化学习策略优化、世界模型构建等方向;
2、研究传统仿真与生成式仿真相结合的数据合成方案,构建机器人及具身智能领域的新型数据范式,推动合成数据在训练与真实场景中的应用;
3、跟踪学术界与工业界最新进展(如VLA、具身智能等),保持技术领先性快速验证关键技术并推动团队技术迭代;
4、推动模型在机器人场景的落地,解决实际应用中的挑战。
包括英文材料
学历+
大模型+
强化学习+
CVPR+
相关职位

logo of bytedance
社招A15783

1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-16
logo of xpeng
实习

我们致力于前沿机器人交互技术的研发,目标是打造能够精准理解人类意图、实现自然流畅人机协作的下一代机器人系统。在这里,您将有机会将最先进的计算机视觉与多模态大模型技术应用于真实的机器人场景,解决极具挑战性的问题,并见证您的算法如何改变人机交互的未来。 负责机器人交互中的核心意图识别算法的研发与迭代,技术方向包括但不限于:目标检测、多目标跟踪、人体/人脸关键点检测、手势识别、行为理解等。 探索并推动多模态大模型在机器人交互场景下的应用与落地,实现基于视觉、语音等多模态信息的深度意图理解。 负责将算法模型进行高效的优化、部署和集成,确保其在真实机器人平台上的性能和稳定性。 持续跟踪计算机视觉、多模态学习、机器人学等领域的最新学术进展,并将有潜力的技术转化为实际生产力。

更新于 2025-09-26
logo of netease
社招3-5年网易伏羲

1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。

更新于 2025-09-25
logo of netease
校招人工智能

1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。