字节跳动多模态智能算法工程师/专家-智能创作

社招全职3年以上A20923B2024-03-18地点：深圳状态：停招

扫码手机上打开

任职要求

1、计算机科学、软件工程、电子工程或相关领域的硕士及以上学历；
2、3年及以上相关领域工作经验，至少熟悉NLP、计算机视觉、机器学习等技术之一；
3、熟练掌握C++/Python等编程语言，具有扎实的编程基础和良好的编码习惯；
4、深入了解深度学习框架，如TensorF…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：智能创作团队是字节跳动创作场景业务中台，负责了抖音、剪映等产品的技术和业务研发，涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域，并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案，同时通过火山引擎为企业客户提供服务。

1、研究和开发多模态智能生成和编辑算法，包括文案、图像、视频等；
2、设计和优化现有算法，提高性能和准确性，确保高质量的用户体验；
3、深入调研和关注多模态/NLP/CV等方向的前沿技术，及时将新技术应用到产品中；
4、与产品经理、设计师和其他工程师紧密合作，确保产品迭代的高效推进。

📰 查看页面 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

OpenCV+

机器学习+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

AIGC素材创意生成算法工程师/专家

社招1-3年J0011

1、负责研发行业领先的AIGC素材创意生成技术，包括多模态理解、多模态检索、多模态生成等前沿技术，应用于电商、商业化、本地生活等场景的创意素材生成与智能创作； 2、负责大模型CPT，Post-training等技术的深入探索与研发，提升创意素材的内容质量； 3、负责研发AIGC素材创意生成平台，实现自动化、智能化的素材创意内容的生成与推荐。

更新于 2025-10-16杭州

多模态模型应用算法工程师/专家-豆包大模型

社招RS151

团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的 AI 大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责多模态大模型的研发和应用，研究相关技术在豆包、智能助手、智能硬件等领域的全新应用和解决方案，包括而不限于多模态理解生成，视觉Agent等能力，研发以人工智能技术为核心的新技术、新产品； 2、探索超大规模模型，进行极致系统优化； 3、数据建设、指令微调、偏好对齐、模型优化； 4、相关应用落地，包括看图对话、问答、搜索、生成创作、逻辑推理、代码生成等； 5、在未来生活中的更多使用场景的深入研究和探索，满足用户不断增长的智能交互需求，全面提升用户在未来世界的生活和交流方式。

更新于 2020-04-26北京

AIGC图像算法工程师/专家

社招3年以上研发类

作为核心算法成员，参与AI图像相关算法研发，主要服务于下一代智能相册系统。主要工作包括：一、图像理解方向： 1）开发基于多模态语义的图像理解算法：人物识别、事件聚类、情绪识别、场景识别等；构建个性化的图像语义标签体系； 2）设计图像内容质量评估模型（重复、模糊、人脸表情等）提升用户体验； 3）探索RAG、多模态图像大模型、文本大模型联动下，agent能力建设和开发。二、图像AIGC方向（创作与编辑）： 1）研究并实现图像生成与编辑算法，如背景替换、人像美化、风格迁移、文生图，图生图等； 2）参与基于 Diffusion基础模型训练； 3）参与ControlNet、Inpainting、aigc编辑大模型等前沿应用模型的业务开发和落地；

杭州|南京|深圳

角色化多模态模型应用算法工程师/专家-豆包大模型

社招A155282

团队介绍：字节跳动豆包大模型团队成立于 2023 年，致力于开发业界最先进的AI大模型技术，成为世界一流的研究团队，为科技和社会发展作出贡献。豆包大模型团队在AI领域拥有长期愿景与决心，研究方向涵盖NLP、CV、语音等，在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源，在相关领域持续投入，已推出自研通用大模型，提供多模态能力，下游支持豆包、扣子、即梦等50+业务，并通过火山引擎开放给企业客户。目前，豆包APP已成为中国市场用户量最大的AIGC应用。 1、多模态引擎研发：研发融合文本、视觉、语音的角色类大模型，优化角色生成的真实性与情感表达（如虚拟助手、游戏NPC、互动剧角色），突破多模态对齐、长期记忆、行为一致性等技术难点； 2、极致性能优化：超大规模模型的分布式训练优化，提升角色类模型的推理效率与资源利用率，指令微调、偏好对齐、数据增强等技术的场景化创新； 3、业务场景落地：支持豆包、猫箱等产品的角色生成需求，覆盖对话、创作、教育等场景，探索角色模型在智能硬件、元宇宙等领域的沉浸式交互能力； 4、前沿探索：研究人格化模型在情感计算、社会常识推理等方向的突破，定义AI角色从「功能执行」到「人格化陪伴」的技术范式。

更新于 2025-02-13北京