logo of bytedance

字节跳动视频生成算法工程师-Seed

校招全职A184982地点:北京状态:招聘

任职要求


1、2026届获得博士学位,计算机、数学等相关专业优先;
2、在计算机视觉一个或多个领域的研究和实践经验,包括但不限于以下方向:
1)图片/视频生成扩散模型;
2)视觉自监督学习/表示学习/生成理解统一;
3)动态模型结构设计;
4)大规模训练经验、SFT或RLHF经验;
3、要求动手能力强,算法能力强,工程能力强优先;
4、工作积极主动,思路有条理性,能够独立完成具有挑战性的前沿研发工作;同时能很好与团队成员协作产出;
5、具有行业影响力高质量论文(一作)优先。

工作职责


团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。

1、参与视频生成基础模型相关结构的研究和开发,包括:VAE,MOE,Dynamic Attention,Streaming Multimodal Model;
2、参与视频生成全流程的研究和开发,包括:Data,Scaling Recipe,SFT,RLHF。
包括英文材料
学历+
OpenCV+
SFT+
算法+
相关职位

logo of bytedance
校招A224597

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与视频生成基础模型相关结构的研究和开发,包括:VAE,MOE,Dynamic Attention,Streaming Multimodal Model; 2、参与视频生成全流程的研究和开发,包括:Data,Scaling Recipe,SFT,RLHF。

更新于 2025-08-06
logo of bytedance
校招A204895

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与视频生成基础模型相关结构的研究和开发,包括:VAE,MOE,Dynamic Attention,Streaming Multimodal Model; 2、参与视频生成全流程的研究和开发,包括:Data,Scaling Recipe,SFT,RLHF。

更新于 2025-08-06
logo of bytedance
校招A106985

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、研发文生图/文生视频等多模态生成大模型的算法加速技术,通过步数蒸馏、MoE、稀疏、轻量化网络、低比特量化等模型层面优化手段,实现生成效率数量级提升; 2、主导生成式模型的创新算法研究,攻克Diffusion模型、自回归模型、多模态理解生成统一大模型等方向的算法加速,通过算法提升模型推理效率; 3、与上下游部门深度合作,分析性能瓶颈,通过算法优化提升模型推理效率,优化多模态视觉生成大模型,推动字节跳动AI关键业务发展。

更新于 2025-04-21
logo of bytedance
社招A232395

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设; 2、负责视觉大模型训练优化算法研究和落地,通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率; 3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能大模型训推引擎; 4、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动字节跳动AI关键业务发展。

更新于 2024-06-06