字节跳动具身智能推理性能优化工程师-Seed

社招全职A157832025-05-16地点：北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，计算机/电子/自动化/软件等相关专业，有AI工程优化经验的优先；
2、精通C/C++，精通算法与数据结构，熟悉Python；
3、了解深度学习算法基本原理，熟悉神经网络基本架构和各算子计算方式，了解至少一种深度学习训练框架；
4、熟练使用GPU或NPU高性能编程技术为模型训练或推理加速，例如：CUDA、CUDNN、CUTLASS、Tri…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责具身智能相关模型云侧和端侧模型的性能优化和部署；
2、运用性能分析工具，对模型推理过程进行性能剖析，定位性能瓶颈，提出有效的优化方案，并通过实验验证优化效果；
3、通过量化、剪枝、蒸馏、算子融合、Cuda算子编写等性能优化的手段，结合业务需求，将GPU性能发挥到极致；
4、与算法部门深度合作，进行算法与系统的联合优化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+

C+++

算法+

数据结构+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

大语言模型算法研究工程师（模型架构优化方向）-Seed

社招A129417

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、设计高效且可靠的模型架构优化方案，确保模型在不同规模下的稳定Scaling； 2、探索超大规模模型性能边界，通过混合精度分布式训练，量化部署等方式优化训练和推理过程； 3、研究下一代模型架构，拓展模型在长文本，推理，科学计算、多模态和具身智能等领域的应用场景。

更新于 2025-04-01北京

机器人算法工程师（基础大模型方向）-26届蓝极星

校招

1、机器人基础模型架构设计与开发:如视觉-语言-动作(VLA)模型的算法研发,包括多模态特征对齐、动作序列生成与推理优化,推动模型在机器人操作场景的端到端能力提升； 2、具身智能多模态系统构建:设计融合视觉、语言与动作的联合训练框架,开发基于Transformer或扩散模型的跨模态交互机制，提升模型在复杂动态环境中的语义理解与决策能力； 3、算法性能优化与工程化:针对具身智能硬件平台(如机械臂、移动机器人)优化VLA等模型的实时推理性能，通过算子融合、量化压缩等技术实现低延迟部署。 4、跨模态数据闭环建设:搭建大规模具身智能数据采集与增强系统,设计数据标注与仿真验证工具链,支撑VLA等模型在真实场景的持续迭代。

更新于 2025-07-25上海|东莞

26届AI领航员-IAG-智能驾驶-高性能计算工程师

校招算法工程

1. 云侧部署与性能优化：主导世界模型及辅助驾驶的软件架构设计及芯片部署方案落地，综合运用指令集优化、线程调度策略、内存池管理等技术，实现极致性能与资源利用率。 2. 端侧部署与性能优化：面向具身智能与智能驾驶领域的高算力平台，VLA算法方案部署与优化加速； 3. 芯片生态深度协作：聚焦英伟达等主流车载芯片平台，完成模型部署与推理性能调优；结合系统及硬件架构特性，协同芯片厂商实现软硬件本地化定制开发，驱动业务需求落地。

更新于 2025-10-21北京|上海

【地瓜机器人】世界模型算法工程师

校招算法序列

职位描述我们正在寻找一位对“物理世界模拟”充满热情的算法专家，共同探索视频生成技术在具身智能（Embodied AI）领域的前沿应用。你将负责构建高度可控、符合物理规律的长时序视频生成模型，将其作为机器人的“虚拟练兵场”或“思维仿真器”。我们的目标不仅仅是生成好看的画面，而是通过视频生成技术（Video Generation）构建强大的世界模型 (World Models)，为强化学习提供高保真度的环境模拟和预测能力。核心职责：架构设计：负责长时序、高保真视频生成模型的架构设计与开发，突破现有模型在时序连贯性（Temporal Consistency）上的瓶颈。可控性研究：探索基于动作（Action-conditioned）、指令或物理参数的可控生成技术，实现模型对复杂交互场景的精准模拟。世界模型集成：将视频生成技术引入具身智能框架，探索自监督学习、因果推理（Causal Modeling）在环境建模中的应用。性能优化：针对大规模模型进行工程优化，提升训练效率与推理速度，支撑海量数据的迭代需求。

更新于 2026-02-04北京