字节跳动具身智能大模型负责人-Seed
任职要求
1、计算机科学、人工智能、数学、机器人学等相关专业,博士学位优先,5年左右大模型相关工作经验; 2、熟悉机器人学、强化学习、多模态融合(VLA)等技术,强烈的学术敏感度与工程化思维,能独立…
工作职责
1、主导具身智能大模型的核心算法研发,包括多模态感知(视觉、语言、动作)、强化学习策略优化、世界模型构建等方向; 2、研究传统仿真与生成式仿真相结合的数据合成方案,构建机器人及具身智能领域的新型数据范式,推动合成数据在训练与真实场景中的应用; 3、跟踪学术界与工业界最新进展(如VLA、具身智能等),保持技术领先性快速验证关键技术并推动团队技术迭代; 4、推动模型在机器人场景的落地,解决实际应用中的挑战。
1、负责具身智能相关模型云侧和端侧模型的性能优化和部署; 2、运用性能分析工具,对模型推理过程进行性能剖析,定位性能瓶颈,提出有效的优化方案,并通过实验验证优化效果; 3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致; 4、与算法部门深度合作,进行算法与系统的联合优化。
打造行业领先的原生具身智能大模型,如VLM/VLA/World Model/Omni。面向通用人形机器人及更广泛的具身场景,构建可泛化、可拓展、可scaling的大模型,负责大规模训练性能与效果优化。 职位要求: 1、计算机、电子工程、人工智能等相关领域硕士及以上学历; 2、具有扎实的机器学习算法基础,在VLM、LLM、AIGC、RL、Robotics、Audio 等相关专业领域有研究经验; 3、具有优秀的代码能力,精通PyTorch/TensorFlow等深度学习框架,熟悉大规模训练栈:大规模训练框架,加速方法; 4、具有良好的团队合作能力和沟通能力。
我们致力于前沿机器人交互技术的研发,目标是打造能够精准理解人类意图、实现自然流畅人机协作的下一代机器人系统。在这里,您将有机会将最先进的计算机视觉与多模态大模型技术应用于真实的机器人场景,解决极具挑战性的问题,并见证您的算法如何改变人机交互的未来。 负责机器人交互中的核心意图识别算法的研发与迭代,技术方向包括但不限于:目标检测、多目标跟踪、人体/人脸关键点检测、手势识别、行为理解等。 探索并推动多模态大模型在机器人交互场景下的应用与落地,实现基于视觉、语音等多模态信息的深度意图理解。 负责将算法模型进行高效的优化、部署和集成,确保其在真实机器人平台上的性能和稳定性。 持续跟踪计算机视觉、多模态学习、机器人学等领域的最新学术进展,并将有潜力的技术转化为实际生产力。