logo of amap

高德地图AIGC多模态算法工程师-视频生成/理解方向-APP平台业务

实习兼职高德地图2026届春季校园招聘地点:北京状态:招聘

任职要求


职位要求
1.理工科:计算机相关的硕士/博士在读;
2.在图像/视频生成领域有一定的经验,对大模型,diffusion,auto-regressive,RL,GRPO等相关技术掌握
3.对视频生成的aligment,high quality,long video,推理加速等方面有一…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
我们团队在多模态大模型,视频生成/视频理解等多个方向都有业界影响力的工作产出,在这里,你将与算法精英共事,提升你的技术实力和创新能力。团队可以为你提供足够的计算资源和数据资源。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,多篇论文入选paper digest最有影响力论文名单。

岗位职责包括但不限于:
1. 负责视频生成/视频理解技术的前沿技术的研究,并且能够使用到落地的视频生成模型中,提升视频生成模型的效果,
2. 针对视频生成的某一个领域问题,能够做到问题建模,创新性提出优化方法和模型训练;
3. 调研前沿技术,发表顶级论文。
包括英文材料
大模型+
深度学习+
TensorFlow+
PyTorch+
CVPR+
还有更多 •••
相关职位

logo of xiaohongshu
校招AIGC算法

创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。

更新于 2026-01-08北京|上海
logo of xiaohongshu
校招AIGC算法

创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。

更新于 2026-01-08北京|上海
logo of pinduoduo
社招2年以上技术类

1.生成模型研发: 负责高质量图像与视频生成模型的选型、训练与调优(如Stable Diffusion、DiT、Video Generation Models),针对业务需求开发可控生成方案(ControlNet、LoRA、Adapter),实现广告素材自动化生成、商品图智能设计等。 2.多模态理解与检索: 构建高性能的多模态理解与表征模型(CLIP、BLIP、MLLM),优化跨模态检索(Text-to-Image/Video Retrieval)和内容打标能力,赋能搜索相关性提升及推荐系统的多模态召回与排序。 3.业务场景落地: 深入理解搜推广业务,设计AIGC在广告创意优化、搜索结果增强(Generative Search)、短视频内容重组等场景的应用链路;建立A/B实验体系,对AIGC生成内容的点击率(CTR)、转化率(CVR)及用户留存负责。 4.数据与系统优化: 构建大规模高质量的图文/视频训练数据集与美学评分体系;与Infra团队配合,优化生成模型的推理延迟与吞吐(如Distillation、Quantization),确保在线服务的高并发稳定性。

更新于 2026-01-08上海
logo of bytedance
社招5年以上A86146A

1、负责基础模型和生成式人工智能的基础能力建设和业务落地,包括但不限于文本生成/翻译、图生文、深伪技术、大模型高效训练/推理等等,追踪业界最前沿进展,并进行前瞻性的技术研究; 2、带领团队将AIGC相关技术在广告、电商、短视频、直播等商业产品的内容理解上落地,构建新一代基于大模型的商业化生态; 3、负责大模型算法团队的项目规划、团队建设、跨团队合作,打造行业领先的内容理解算法团队。

更新于 2024-03-11上海