字节跳动AIGC算法工程师-Data AML

校招全职A1344582025-08-04地点：杭州状态：招聘

扫码手机上打开

任职要求

1、2026届获得硕士及以上学位，计算机等相关专业；
2、在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有较深入的研究；
3、熟悉生成相关技术路线，包括扩散模型，自回归模型，GAN等，有训练经验、AIGC、LLM和RLHF等相关经验；
4、动手能力强，具有熟练的算法和编程能力，熟悉C/C++和P…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：Data AML是字节跳动的机器学习中台，为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力，并在这些业务的问题上研究一些具有通用性和创新性的算法。同时，也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。

1、负责豆包模型AIGC相关技术的研究和开发，包括图像、视频或3D生成&编辑等，探索基于扩散和自回归的技术路线，以实现高质量的输出；
2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题；
3、紧跟生成方向（扩散模型、Transformer、生成对抗网络等）的最新研究动态，并对创新想法进行原型验证；
4、依托公司和业界的大模型和基础CV技术，构建面向ToB业务应用的多模态算法能力，帮助业务取得成功。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

机器学习+

大模型+

算法+

C+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

AIGC算法工程师-Data AML

校招A144402

团队介绍：Data AML是字节跳动的机器学习中台，为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力，并在这些业务的问题上研究一些具有通用性和创新性的算法。同时，也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发，包括图像、视频或3D生成&编辑等，探索基于扩散和自回归的技术路线，以实现高质量的输出； 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题； 3、紧跟生成方向（扩散模型、Transformer、生成对抗网络等）的最新研究动态，并对创新想法进行原型验证； 4、依托公司和业界的大模型和基础CV技术，构建面向ToB业务应用的多模态算法能力，帮助业务取得成功。

更新于 2025-08-04深圳

AML多模态算法工程师（智能内容）-Data

社招A05659

1、支持快速增长的内容套件业务，基于CV和多模态技术建立相应的标签体系； 2、探索多模态技术对不同领域场景的业务支持，提升用户消费核心指标； 3、处理丰富的多模态内容，为搜索、推荐提供底层技术支持； 4、探索多模态AIGC内容的生成，包括文生图、图生文等。

更新于 2024-06-17北京

淘宝闪购-AI工程师-零售商品

社招3年以上技术类-开发

1、驾驭亿级规模核心系统：负责本地零售亿级商品库的顶层架构设计与演进，主导 SPU/CSPU 等基础模型建设，支撑高并发下的搜索、选品及多渠道分发，打造行业领先的商品数据底座。 2、引领前沿的 AI 大模型落地：深度参与AIGC 在商品全生命周期的变革，利用多模态大模型重塑智能发品、自动归类、内容生成及质量质检流程，推动业务从“人工运营”向"智能自治"跃迁。 3、构建数据与智能闭环：携手算法与产品团队，建立“数据 - 模型 - 业务”的高效反馈闭环。通过RAG 知识库、批量推理及自动化实验等前沿技术，持续优化商品数据的准确性与转化效率，赋能零售搜索与智能决策。 4、探索研发新范式与极致性能：在保障系统高可用与极致稳定性的同时，率先探索 Vibe Coding、AI Agent 等新范式在研发流中的落地，提升团队整体效能，解决海量数据下的复杂工程挑战。

更新于 2026-03-27上海

高德-AIGC多模态生成&理解算法工程师/专家-北京

社招3年以上技术类-算法

团队介绍：高德地图机器学习研发部是公司AI核心技术引擎，聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地，支撑亿级用户产品，同时长期投入前沿探索，在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文，多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源，鼓励创新突破，诚邀你与顶尖算法专家并肩，共同定义AI的未来！如果你渴望挑战多模态与生成式AI的技术巅峰，在视频、图像、大模型的交叉领域实现突破，欢迎加入我们！团队的github页面是：https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发，见证技术直接赋能业务； • 与学术大牛和工业界专家共事，持续提升技术视野； • 顶配算力资源+开放创新氛围，支持前沿探索与顶会论文发表。具体职责包括但不限于： 1. 视频生成：负责视频生成技术的前沿技术的研究，对AIGC的diffusion和auto-regressive技术有深入了解，在T2I/AIGCT2V/I2V上面有一定的研究，图文对齐，长视频生成等有一定的研究，做好视频生成在高德业务（广告，POI详情页等）中的进行落地。 2. 视频理解：能够使用和优化多模态大模型对用户上传的视频进行质量理解，标签，densecaption，视频summary等生成，作用到视频的搜索，广告，推荐等业务的落地。 3. 世界模型：参与世界模型的构建，能够使用最新的视频生成技术，3D技术等构建符合人类物理规律的统一的世界模型，在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀，形成顶会论文和专利。

更新于 2026-01-23北京