logo of mihoyo

米哈游视频生成资深研究员

社招全职程序&技术类地点:上海状态:招聘

任职要求


任职要求:
1、学历背景:人工智能、计算机科学等相关专业硕士及以上学历
2、有大模型(文本、语音、视频、图像等)训练经验,对模型架构有深刻理解和优化经验
3、研究能力:具备独立的科研思维,能够阅读前沿论文并提出创新性改进方案,有大规模生成模型的相关文章或项目经验
4、工程经验:熟悉…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


专注于视频生成模型的研究与开发,参与构建下一代视频AI系统,探索视频内容的深度理解与高质量生成的统一建模方法,目标是构建以人为中心的实时视频生成模型。

核心职责:
1、参与音视频生成模型架构设计、模型预训练和后训练
2、前沿技术探索与实现,探索Diffusion Model、Auto-regressive Model在音视频生成中的性能上限
3、研究文本-视频-音频多模态对齐技术和条件控制方法
4、大规模音视频生成模型训练及加速优化,实现实时视频生成
包括英文材料
学历+
还有更多 •••
相关职位

logo of tencent
社招3年以上ARC预研技术

1.负责多模态理解和统一大模型方向的研究与开发; 2.探索基于文本的高保真长视频生成方法,解决现有技术的局限性; 3.深入研究三维物理世界的建模与对应的物理规律,提升视频生成质量; 4.优化视频生成模型的控制与编辑流程,提高生产效率。

更新于 2025-10-22深圳
logo of bilibili
社招技术类

1.跟进多模态大模型的最新研究进展和技术实现(包括但不限于视频理解、视频问答、视频caption等),将多模态大模型内容理解能力与广告业务相结合,提升广告模型匹配效率 2.跟进和研发基于扩散模型的图像生成、视频生成等前沿技术,用于广告图片、视频等创意素材的内容生成 3.跟进和研发大语言模型LLM的指令微调、RLHF 等技术,结合广告业务场景落地关键词提取、智能对话、广告标题或文案生成等多个下游任务 4.结合上述多模态理解和AIGC生成能力,构建自动化素材生产和投放优化平台,挖掘站内优质内容,自动化编辑、剪辑制作素材,并基于数据驱动优化素材投前、投中环节的效果

更新于 2025-06-27上海
logo of baidu
社招5-10年MEG

-负责AIGC团队多模态相关业务的算法研发,工作内容包括但不限于:图像/视频的生成与理解,如图像编辑、文生图、图生图、图生视频、语义匹配等 -负责AIGC多模态中台能力建设,追踪并落地应用多模态前沿技术 -负责模型训练和推理性能优化,探索多模态算法新范式 -探索AIGC在具体业务的产品新形态

更新于 2024-08-14北京
logo of baidu
社招MEG

-参与公司深度学习推理引擎、AI编译器的架构设计、开发和优化,确保领域内推理引擎技术的先进性 -参与多模态LLM、视频生成模型推理性能性能的极致优化,保持业界SOTA -研究最近的推理优化技术,跟踪最新研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并应用到业务 -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战

更新于 2025-04-25北京