logo of bytedance

字节跳动视频生成算法研究员-Seed大模型人才校招

校招全职A170398地点:上海状态:招聘

任职要求


1、2027届获得本科及以上学历,计算机、电子、数学等相关专业;
2、要求至少具备以下某一方向的研究和实践经验,同时具备多方向经验者优先:
1)图片/视频生成扩散模型,核心环节大规模训练实战经验;
2)视觉自监督学习/表示学习/VAE的前沿研究经验;
3)模型结构设计,如MOE,A…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


Seed 大模型人才校招,是字节跳动 Seed 面向高校人才推出的招聘项目。我们始终相信,真正重要的技术进步来自对高难度问题的持续挑战。面对 AI 时代的巨大机遇,Seed 团队并不止步于模型迭代,而是选择进入技术深水区,推进下一代 AI 范式突破,不断探索智能的边界与上限。

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。
Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。

视频生成团队负责与视频生成相关的 foundation model 基础研究,包括了多模态生成、多模态实时交互、视觉智能基础模型/表示等相关方向。团队于26年2月推出 Seedance 2.0,SoTA 音视频&多模态能力世界领先,支持豆包、即梦、火山引擎、抖音、剪映等核心业务场景。

1、参与视频生成基础模型相关结构的研究和开发,包括:VAE,MOE,Attention,动态稀疏结构,超长序列建模,原生多模态表征与架构,AR+Diffusion架构与应用探索;
2、参与视频生成基础模型全流程的研究和开发,围绕视频生成的新应用/产品研发。
包括英文材料
学历+
相关职位

logo of bytedance
校招A07246A

Seed 大模型人才校招,是字节跳动 Seed 面向高校人才推出的招聘项目。我们始终相信,真正重要的技术进步来自对高难度问题的持续挑战。面对 AI 时代的巨大机遇,Seed 团队并不止步于模型迭代,而是选择进入技术深水区,推进下一代 AI 范式突破,不断探索智能的边界与上限。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。 Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、探索全模态流式视频理解模型,内容包括但不限于支持无限长序列流式输入,高功能主动响应能力,超低延时推理与响应,全领域实时解说,Learning From Video等 5、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2026-03-28北京
logo of sensetime
校招算法研究

1. 实时视频生成算法研究: 紧密追踪并深入研究实时视频生成领域的最新进展,积极探索新的模型架构、训练范式、优化策略和硬件加速方案,实现并验证工业界可落地的方案; 2. 模型设计与优化: 负责实时视频生成模型的设计、训练、评估和优化,在保证视频质量的同时,大幅提升生成速度和计算效率; 3. 性能瓶颈分析与解决: 针对实时性要求,深入分析现有算法和系统的性能瓶颈,并提出有效的解决方案,确保视频生成流程的流畅与高效。

更新于 2025-08-21北京|上海|深圳
logo of sensetime
社招算法研究

岗位职责: 1. 负责自动驾驶世界模型/视频生成/场景重建的技术研究 2. 负责世界模型在自动驾驶长尾数据生成、闭环仿真场景生成领域的落地,解决实际应用中的关键问题 3. 跟进世界模型相关前沿技术,保持团队在业界的领先性,总结工作成果

更新于 2025-05-20北京
logo of sensetime
实习算法研究

1. 算法研发:聚焦自动驾驶、车载或机器人领域的算法和模型研发,不限于世界模型、视频生成模型、多模态大模型和VLA模型。 2. 业务落地:负责车载和自动驾驶业务的研究、设计、开发和优化工作。参与项目的需求分析、设计评审和代码评审。跟踪和研究领域的前沿技术和趋势,为项目提供技术支持。

更新于 2025-06-30北京|上海