logo of bytedance

字节跳动推理性能优化工程师-豆包视频生成模型PixelDance

社招全职A74647B地点:上海状态:招聘

任职要求


1、本科及以上学历,计算机/电子/自动化/软件等相关专业,有AI工程优化经验的优先;
2、精通C/C++,精通算法数据结构,熟悉Python;
3、熟练GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
4、具备丰富的基于CUDA的GPU性能优化经验;
5、了解深度学…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:我们是「豆包视频生成模型-PixelDance」团队,我们专注于开发视频生成模型,解决视频生成的关键问题,包括但不限于高动态性视频生成、内容一致性保障。构建行业领先的视频基础模型,引领技术的未来潮流。视频生成工程团队的工作涉及到模型生产的全周期流程,在这里,你有机会参与到模型的数据生产、训练加速、推理加速、服务部署的每个环节。同时你将接触到最先进的视频生成技术、海量的数据、大规模的集群,我们期待你能够和我们的模型一同Scale UP。

1、负责LLM和Diffusion Model的性能优化;
2、通过TensorRT、量化、剪枝、算子融合、CUDA算子编写等性能优化的手段,结合业务需求,将GPU性能发挥到极致;
3、负责ByteDance Research推理优化技术的调研和引入;
4、与算法部门深度合作,进行算法与系统的联合优化。
包括英文材料
学历+
C+
C+++
算法+
数据结构+
Python+
还有更多 •••
相关职位

logo of bytedance
校招A137077A

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责构建新一代大模型推理引擎,优化图像生成/视频生成等多模态生成大模型在GPU集群上的推理性能,实现低延迟、高吞吐的工业级部署; 2、主导模型推理性能优化,涵盖CUDA/Triton算子开发、TensorRT/TRT-LLM图优化、分布式推理策略、量化技术及基于PyTorch的编译优化; 3、研发GPU推理加速技术栈,优化多卡协同计算、PCIe通信与高并发服务架构; 4、与上下游部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动字节跳动AI关键业务发展。

更新于 2025-04-21北京
logo of bytedance
校招A101043A

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责文生图/文生视频/多模态理解等大模型的算法加速工作,通过前沿算法手段对模型完成深度性能优化; 2、探索并实践前沿的模型压缩与加速算法,包括但不限于蒸馏、剪枝、稀疏化、混合专家(MoE)、低比特量化(如INT8/INT4)、Cache等模型层优化手段,实现推理效率的量级提升; 3、参与生成和理解模型的创新算法研究,致力于提升扩散模型、多模态理解、多模态统一大模型等多种视觉前沿范式的推理效率; 4、与算法和业务团队紧密合作,将前沿的优化技术落地到实际产品中,持续迭代,打造业界顶尖的AIGC服务。

更新于 2025-07-24深圳
logo of bytedance
校招A106985

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、研发文生图/文生视频等多模态生成大模型的算法加速技术,通过步数蒸馏、MoE、稀疏、轻量化网络、低比特量化等模型层面优化手段,实现生成效率数量级提升; 2、主导生成式模型的创新算法研究,攻克Diffusion模型、自回归模型、多模态理解生成统一大模型等方向的算法加速,通过算法提升模型推理效率; 3、与上下游部门深度合作,分析性能瓶颈,通过算法优化提升模型推理效率,优化多模态视觉生成大模型,推动字节跳动AI关键业务发展。

更新于 2025-04-21北京
logo of bytedance
社招A157804

团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索LLM适性索引、LLM相关性、生成式召回、排序大模型等; 2、构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、训练和优化AI搜索的机器学习模型(多模态内容理解、指令微调、索引筛选、Query分析、Scalable Oversight、Long CoT、模型推理/规划、模型优化、构建全面客观准确的评测体系等); 3、探索推进AI搜索、AIGC创新应用的落地(包含而不限于豆包、电商、抖音、智能硬件、AI找搭配/虚拟穿搭等大模型应用场景),研发以人工智能技术为核心的新技术、新产品,探索满足用户的智能交互需求,提升现实与物理世界的交互能力。

更新于 2025-02-25北京