logo of amap

高德地图AIGC多模态算法工程师-视频生成/理解方向-APP平台业务

实习兼职高德地图2026届春季校园招聘地点:北京状态:招聘

任职要求


职位要求
1.理工科:计算机相关的硕士/博士在读;
2.在图像/视频生成领域有一定的经验,对大模型,diffusion,auto-regressive,RL,GRPO等相关技术掌握
3.对视频生成的aligment,high quality,long video,推理加速等方面有一…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
我们团队在多模态大模型,视频生成/视频理解等多个方向都有业界影响力的工作产出,在这里,你将与算法精英共事,提升你的技术实力和创新能力。团队可以为你提供足够的计算资源和数据资源。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,多篇论文入选paper digest最有影响力论文名单。

岗位职责包括但不限于:
1. 负责视频生成/视频理解技术的前沿技术的研究,并且能够使用到落地的视频生成模型中,提升视频生成模型的效果,
2. 针对视频生成的某一个领域问题,能够做到问题建模,创新性提出优化方法和模型训练;
3. 调研前沿技术,发表顶级论文。
包括英文材料
大模型+
深度学习+
TensorFlow+
PyTorch+
CVPR+
还有更多 •••
相关职位

logo of xiaohongshu
校招AIGC算法

创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。

更新于 2026-01-08北京|上海
logo of xiaohongshu
校招AIGC算法

创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。

更新于 2026-01-08北京|上海
logo of alibaba
社招1年以上

1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。

更新于 2026-04-01杭州
logo of aligenie
社招1年以上

1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。

更新于 2026-04-02杭州