米哈游视频生成资深研究员
社招全职程序&技术类地点:上海状态:招聘
任职要求
任职要求: 1、学历背景:人工智能、计算机科学等相关专业硕士及以上学历 2、有大模型(文本、语音、视频、图像等)训练经验,对模型架构有深刻理解和优化经验 3、研究能力:具备独立的科研思维,能够阅读前沿论文并提出创新性改进方案,有大规模生成模型的相关文章或项目经验 4、工程经验:熟悉…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
专注于视频生成模型的研究与开发,参与构建下一代视频AI系统,探索视频内容的深度理解与高质量生成的统一建模方法,目标是构建以人为中心的实时视频生成模型。 核心职责: 1、参与音视频生成模型架构设计、模型预训练和后训练 2、前沿技术探索与实现,探索Diffusion Model、Auto-regressive Model在音视频生成中的性能上限 3、研究文本-视频-音频多模态对齐技术和条件控制方法 4、大规模音视频生成模型训练及加速优化,实现实时视频生成
相关职位
社招3年以上ARC预研技术
1.负责多模态理解和统一大模型方向的研究与开发; 2.探索基于文本的高保真长视频生成方法,解决现有技术的局限性; 3.深入研究三维物理世界的建模与对应的物理规律,提升视频生成质量; 4.优化视频生成模型的控制与编辑流程,提高生产效率。
更新于 2025-10-22深圳
社招技术类
1.跟进多模态大模型的最新研究进展和技术实现(包括但不限于视频理解、视频问答、视频caption等),将多模态大模型内容理解能力与广告业务相结合,提升广告模型匹配效率 2.跟进和研发基于扩散模型的图像生成、视频生成等前沿技术,用于广告图片、视频等创意素材的内容生成 3.跟进和研发大语言模型LLM的指令微调、RLHF 等技术,结合广告业务场景落地关键词提取、智能对话、广告标题或文案生成等多个下游任务 4.结合上述多模态理解和AIGC生成能力,构建自动化素材生产和投放优化平台,挖掘站内优质内容,自动化编辑、剪辑制作素材,并基于数据驱动优化素材投前、投中环节的效果
更新于 2025-06-27上海
社招5-10年MEG
-负责AIGC团队多模态相关业务的算法研发,工作内容包括但不限于:图像/视频的生成与理解,如图像编辑、文生图、图生图、图生视频、语义匹配等 -负责AIGC多模态中台能力建设,追踪并落地应用多模态前沿技术 -负责模型训练和推理性能优化,探索多模态算法新范式 -探索AIGC在具体业务的产品新形态
更新于 2024-08-14北京