logo of antgroup

蚂蚁金服蚂蚁集团-图像 / 视频生成算法工程师-AIGC方向

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 计算机、人工智能、数学、电子工程等相关专业,本科及以上学历,硕博优先。  
2. 精通深度学习理论,熟悉常用框架(如 PyTorchTensorFlow),能够独立实现和调优深度生成模型。  
3. 有 Diffusion Models、GAN、VAE 等生成式建模经验,熟悉 Stable Diffusion、Imagen、DALL·E 或相关开源项目。  
4. 熟悉 Transformer 在视觉、视频任务中的应用,如 Vision Transformer、Video Transformer、Latent Diffusion 等。  
5. 有多模态任务经验(如文本转图像、文本转视频、视频到视频),掌握 CLIP、BLIP、align 模型等跨模态技术。  
6. 具备模型可控性技术经验,例如 ControlNet,LoRA,DreamBooth,条件生成等。  
7. 熟悉数据处理与增强方法,能够…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责深度学习、生成式模型在图像与视频生成领域的研发与优化,包括文本生成图像(text-to-image)、文本生成视频(text-to-video)、图像/视频编辑等。  
2. 研究并实现前沿的生成模型架构(如 Diffusion Models、GAN、Transformer、NeRF 等)以及多模态融合技术(文本、音频、视频、图像)。  
3. 结合业务需求,设计和训练高质量的生成模型,提升生成结果的真实感、美学质量、语义一致性和可控性。  
4. 建立数据采集与清洗流程,构建高质量的训练、微调和评估数据集(涵盖图像、视频、多模态)。  
5. 设计、实现并维护模型推理服务,包括模型部署、性能优化、成本控制和稳定性保障。  
6. 对生成模型的评测指标进行研究和完善,包括自动化评分、用户反馈收集、强化学习奖励函数等。  
7. 跟进计算机视觉、生成式AI、多模态领域业界及学术新技术,并快速验证和落地。
包括英文材料
学历+
深度学习+
PyTorch+
TensorFlow+
Stable Diffusion+
Transformer+
ONNX+
TensorRT+
Docker+
还有更多 •••
相关职位

logo of alibaba
实习淘天集团2026

如果你,期望参与淘天集团海量文本/图像/视频数据的理解与生成等方面的算法研究、系统研发和产品开发; 如果你,期望参与跟踪、探索AIGC方向的前沿技术,打磨SOTA通用/垂域基座模型,提升下游应用的效果,打造团队的技术先进性,提高团队技术影响力; 如果你,期望和聪明、皮实、乐观、自省、追求卓越和自我驱动的优秀战友一起,共同开创视觉技术的新格局; 那还在等待什么,赶紧加入我们吧!

更新于 2025-05-07北京|杭州
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07北京|杭州
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-05-07北京|杭州
logo of alibaba
实习淘天集团T-St

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-08-13北京|杭州