高德地图AIGC多模态算法工程师-视频生成/理解方向-APP平台业务
任职要求
职位要求
1.理工科:计算机相关的硕士/博士在读;
2.在图像/视频生成领域有一定的经验,对大模型,diffusion,auto-regressive,RL,GRPO等相关技术掌握
3.对视频生成的aligment,high quality,long video,推理加速等方面有一…工作职责
团队介绍: 我们团队在多模态大模型,视频生成/视频理解等多个方向都有业界影响力的工作产出,在这里,你将与算法精英共事,提升你的技术实力和创新能力。团队可以为你提供足够的计算资源和数据资源。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,多篇论文入选paper digest最有影响力论文名单。 岗位职责包括但不限于: 1. 负责视频生成/视频理解技术的前沿技术的研究,并且能够使用到落地的视频生成模型中,提升视频生成模型的效果, 2. 针对视频生成的某一个领域问题,能够做到问题建模,创新性提出优化方法和模型训练; 3. 调研前沿技术,发表顶级论文。
创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。
创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。
1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。

1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。