米哈游视频生成资深研究员

社招全职程序&技术类地点：上海状态：招聘

扫码手机上打开

任职要求

任职要求：
1、学历背景：人工智能、计算机科学等相关专业硕士及以上学历
2、有大模型（文本、语音、视频、图像等）训练经验，对模型架构有深刻理解和优化经验
3、研究能力：具备独立的科研思维，能够阅读前沿论文并提出创新性改进方案，有大规模生成模型的相关文章或项目经验
4、工程经验：熟悉…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

专注于视频生成模型的研究与开发，参与构建下一代视频AI系统，探索视频内容的深度理解与高质量生成的统一建模方法，目标是构建以人为中心的实时视频生成模型。

核心职责：
1、参与音视频生成模型架构设计、模型预训练和后训练
2、前沿技术探索与实现，探索Diffusion Model、Auto-regressive Model在音视频生成中的性能上限
3、研究文本-视频-音频多模态对齐技术和条件控制方法
4、大规模音视频生成模型训练及加速优化，实现实时视频生成

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

还有更多 •••

登录查看完整学习资料

相关职位

视频生成算法实习生

实习阿里巴巴日常实习

岗位职责： 1. 基于不同的多模态大模型或者视觉生成模型来解决业务所面临的挑战，包括但不限于视频主观质量评价，图像视频超分等。 2. 深入调研和关注视觉模型等方向的前沿技术，将前沿技术在业务上落地。 3. 在视觉感知/视频质量评价/图像视频超分领域做出单点研究突破，发表高质量论文。

更新于 2026-06-05上海

视频生成模型工程师-Agentic视频生成

实习阿里巴巴日常实习

围绕Agentic视频生成方向，开展视频智能体架构设计、多镜头一致性控制和推理侧扩展相关研究，推动视频生成模型从“单点工具”向“自主系统”演进，并服务于广告营销、短剧创作等实际业务落地。你将参与以下一个或多个方向的工作： 1. 视频Agent工作流构建：面向复杂剧情生成场景，研究视频Agent的核心组件，包括任务自主拆解、长短期记忆机制、工具调用及自我反思与修正。通过SFT/RLHF/DPO等后训练技术，提升模型在分镜规划与多维指令遵从上的能力，探索从模糊意图到高质量长视频生成的端到端智能体方案。 2. 可控生成与长视频能力：面向商业级视频交付需求，研究基于Agent上下文记忆的多镜头一致性控制算法，攻克复杂场景下角色IP、场景特征与运动规律的稳定性难题。通过后训练，重点突破长视频生成的时空稳定性与长效剧情逻辑，提升模型在长时序列下的生成质量。同时研究视频大模型在推理阶段的Test-time Scaling策略，突破模型在复杂提示词下的语义对齐上限。 3. 视频智能体评测与进化：构建完善的视频Agent量化评测体系，涵盖视觉一致性、意图命中率、任务完成度等核心维度，打通从数据采集、自动评测到模型在线迭代的闭环。结合广告、漫剧等具体业务场景，参与Agent系统的设计与优化，显著提升商业化视频生成的可用率与交付效率。

更新于 2026-04-13杭州

视频生成算法工程师-【可灵团队】

社招1-3年J0011

1、从事视频GenAI领域的技术创新及落地，参与可灵模型全链路的研发与突破。重点解决低成本、高品质视频生成，以及可控、编辑、互动等关键问题。

更新于 2026-06-09北京

视频生成算法工程师

社招J0011

从事视频AIGC领域（类Sora）的算法探索和落地开发，包括基础模型的框架设计与预训练，以及面向实际应用的优化。

更新于 2026-06-09深圳