蚂蚁金服蚂蚁集团-图像 / 视频生成算法工程师-AIGC方向

社招全职3年以上技术类-算法2026-04-01地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机、人工智能、数学、电子工程等相关专业，本科及以上学历，硕博优先。  
2. 精通深度学习理论，熟悉常用框架（如 PyTorch、TensorFlow），能够独立实现和调优深度生成模型。  
3. 有 Diffusion Models、GAN、VAE 等生成式建模经验，熟悉 Stable Diffusion、Imagen、DALL·E 或相关开源项目。  
4. 熟悉 Transformer 在视觉、视频任务中的应用，如 Vision Transformer、Video Transformer、Latent Diffusion 等。  
5. 有多模态任务经验（如文本转图像、文本转视频、视频到视频），掌握 CLIP、BLIP、align 模型等跨模态技术。  
6. 具备模型可控性技术经验，例如 ControlNet，LoRA，DreamBooth，条件生成等。  
7. 熟悉数据处理与增强方法，能够…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责深度学习、生成式模型在图像与视频生成领域的研发与优化，包括文本生成图像（text-to-image）、文本生成视频（text-to-video）、图像/视频编辑等。  
2. 研究并实现前沿的生成模型架构（如 Diffusion Models、GAN、Transformer、NeRF 等）以及多模态融合技术（文本、音频、视频、图像）。  
3. 结合业务需求，设计和训练高质量的生成模型，提升生成结果的真实感、美学质量、语义一致性和可控性。  
4. 建立数据采集与清洗流程，构建高质量的训练、微调和评估数据集（涵盖图像、视频、多模态）。  
5. 设计、实现并维护模型推理服务，包括模型部署、性能优化、成本控制和稳定性保障。  
6. 对生成模型的评测指标进行研究和完善，包括自动化评分、用户反馈收集、强化学习奖励函数等。  
7. 跟进计算机视觉、生成式AI、多模态领域业界及学术新技术，并快速验证和落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

深度学习+

PyTorch+

TensorFlow+

Stable Diffusion+

Transformer+

ONNX+

TensorRT+

Docker+

还有更多 •••

登录查看完整学习资料

相关职位

算法工程师-电商AIGC视频与图像生成模型方向（T-Star Lab 日常实习）

实习阿里巴巴日常实习

岗位课题： 1.电商视频生成模型研发 2.多个视频应用模型研发 3.原生支持中文的图像生成模型研发 4.有语义泛化性的图像编辑模型研发课题背景： AIGC 生成已成为广告创意制作的主流制作形式，基于AIGC 图像和视频生成模型提供了丰富的素材并持续提升创意制作的美观度和多样性。同时视频和图像生成模型也是各科技公司在AI 领域争夺的中心领域之一。阿里妈妈在过去两年从业务需求出发，持续研发电商领域的多模态生成模型，推出了淘宝星辰视频生成模型、图生视频模型、短视频模型、服饰模特生图模型、图文海报制作等多个原创能力，并成功落地万相营造、万相台无界版、千牛、光合平台、生意管家等多个工具平台和展示、搜索、外投等多个投放场景的创意制作。岗位职责：你将有机会参与核心多模态大模型研究工作，深入到数据准备 | Caption | 训练系统搭建 | Encoder | Pretraining | Continuous training | SFT | Post training 等多模态生成的方方面面，亲手解决大模型研发的问题，并最终交付电商场景领先的生成模型，以及有机会提前获得校招T-Star的正式Offer。

更新于 2026-03-20北京|杭州

图像视频生成算法实习生 (Jan - Jun 2026)

实习

Location: Beijing THE ROLE: AMD is looking for an AI R&D intern to join our growing team. As a key contributor you will be part of a leading team to drive and enhance AMD’s abilities to explore the highest quality, academic/industry-leading technologies. THE PERSON: The ideal candidate possesses an innovative and problem-solving mindset, has a keen eye for Software engineering development, and is diligent and passionate about Technology. A successful candidate will need to employ strong knowledge in computer technologies, and SW engineering expertise as well as a strong ability to compete effectively in a fast-paced, relevant environment while working with different teams of engineers and collaborators. KEY RESPONSIBILITIES: Research the latest advancements and technologies in Generative AI, more specifically image/video/world generation, MLLM, designing and developing innovative applications aligned with company needs. Study the SOTA generation algorithms and enhance the accuracy and performance of existing models. Explore optimized deployment approaches ensuring efficiency in production environments. Collaborate with teams, share best practices, and provide guidance and support on Generative AI technologies.

更新于 2025-09-24北京

图像和视频生成算法实习生

社招算法研究

1，算法创新，探索扩散模型在图像视频生成领域，画质，动态性提升的方法 2，算法创新，探索扩散模型推理提速的蒸馏方法和无需训练的方法 3，业务支持，改进现有扩散模型以实现目前业务所需的一些特性，如提高人像一致性，长视频生成的稳定性，指令遵循能力等 4，业务支持，改进现有扩散模型以实现流式地生成

更新于 2025-11-27北京|上海

AI原生应用-视频图像生成算法-杭州

社招2年以上

1.负责文生图、图生图、图生视频等相关场景的算法研发工作； 2.跟踪前沿技术发展，提出技术创新方案，推动落地，并推动行业创新。 3.研究并实践基于大数据、人工智能、计算机视觉、机器学习等领域的新技术在图片生产、编辑、审核、分发、推荐等各个环节的应用； 4.深入理解业务和算法原理，结合业务特点进行业务洞察和分析，探索视频生成算法应用价值，与产品共建视频生成的全链路。

更新于 2026-07-09杭州