字节跳动高性能优化工程师-Seed

社招全职A2485062025-05-16地点：北京状态：招聘

扫码手机上打开

任职要求

1、计算机或相关专业研究生及以上学历；
2、熟练使用Python与C++，有良好的数据结构和算法基础，了解计算机体系结构；
3、熟悉PyTorch/TensorFlow之一的训练框架，具备模型性能分析手段；…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、使用混合精度、算子融合、分布式计算等手段，加速AI4S模型的训练和推理；
2、与算法团队深入合作，使用AI模型解决材料与生物领域复杂科学问题；
3、跟踪业界的最新进展，与团队共同建立广泛深入的专业认知。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

C+++

数据结构+

算法+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

推理GPU性能优化工程师/专家-Seed

社招A00725A

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责开发和优化字节跳动公司级的大模型推理框架； 2、主要通过GPU、CUDA性能优化的手段，结合线上实际情况，打造业界领先的高性能LLM推理引擎； 3、负责机器学习系统前瞻技术的调研和引入； 4、与算法部门深度合作，进行算法与系统的联合优化。

更新于 2024-05-08北京

高性能计算研发工程师-Seed

社招3年以上A14035

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责语音场景下高性能训推计算平台开发，支撑各业务场景下的训练、推理性能优化需求并推动业务落地； 2、负责训推高性能方案建设，跟进前沿技术，补足关键能力，构建领先的高性能训推平台。

更新于 2023-04-21上海

高性能计算研发工程师-Seed

社招A232395

团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等，在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心，坚持深耕基础，期望成为世界一流的 AI 研究团队，为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、扣子、即梦等超过 50 个应用场景。 1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设； 2、负责视觉大模型训练优化算法研究和落地，通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率； 3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术，打造业界领先的高性能大模型训推引擎； 4、与算法部门深度合作，分析性能瓶颈，通过软硬结合提升模型训推效率，优化和部署视觉大模型，支持AI工具链和技术生态建设，推动字节跳动AI关键业务发展。

更新于 2024-06-06北京

AI异构计算优化工程师-Seed

社招A54366

团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的 AI 大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、评估：负责评估符合业务要求的异构计算芯片，建立/完善评估体系、负载模型，预估业务收益； 2、推理：负责异构计算芯片落地实际推理业务，适配异构计算芯片特性，降低推理时延，提高推理吞吐； 3、训练：负责异构计算芯片落地实际训练业务，根据芯片计算、通信特性，优化显存占用，提高训练吞吐； 4、算子：负责开发异构计算芯片的高性能算子，根据芯片特性，优化算力、带宽利用率； 5、编译：负责通过编译技术实现异构计算芯片在不同业务场景中落地，负责实现更加高效的异构硬件编程范式； 6、调研：负责调研、验证前沿软硬件结合方向，比如稀疏计算（Sparse Computation）、存内计算（In-Memory Computing）、数据流计算（DataFlow）等。

更新于 2024-05-08上海