米哈游动作生成研究员
社招全职程序&技术类地点:上海状态:招聘
任职要求
1. 学历背景:人工智能、计算机科学等相关专业硕士及以上学历; 2. 模型经验:有生成模型的训练经验(可以是图像、视频,或者动作等),熟悉常见的模型架构; 3. 研究能力:具备独立的科研思维和分析解决问题能力,能够把握相关领域的核…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
专注于3D虚拟人动画相关技术的研究与开发,实现高效和高表现力的表情生成和肢体动作生成,提升虚拟人的真实感。探索更加可控的动画生成技术,以及3D和视频、音频,以及大语言模型的融合方案。 1. 利用3D动画数据,实现接近GT表现的表情和动作生成; 2. motion representation:研究人体动画数据的表征方式,优化重建和生成效果; 3. 利用视频数据或视频模型,以更可扩展的方式,来实现3D肢体动画的生成; 4. 多模态融合:探索表情/肢体动作生成,和音频模型/大语言模型的深度融合方案; 5. 可控生成:探索虚拟人在不同输入条件下的可控动作生成。
相关职位
校招核心本地商业-基
研究方向一:图像生成大模型技术研究 1.负责下一代图像生成模型架构建设,包括但不限于AR-Diffusion、生成编辑统一架构构建; 2.负责生图专项能力升级,包括Reward model设计、多语言文字生成能力。 研究方向二:视频生成大模型技术研究 1.负责下一代视频生成模型架构建设,以及高效率、低精度损失、高压缩比的视频VAE和tokenizer建设; 2.负责视频生成下游功能拓展,包括多概念注入生成、交互式生成、长视频生成等。 研发方向三:视觉内容创作Agent 1.负责对话式创作助手核心能力攻坚,包括图像视频创作场景的CoT能力、交互式编辑能力提升。 2.负责图文海报、剧情化成片等典型应用场景的模型微调、Agent能力建设。 研究方向四:拟人化多模交互前沿路线研究 1.构建多模输入的人物视频生成模型,具备高度拟人化的面部驱动、人体动作生成。 2.构建基于多模态大模型的端到端交互模型,实现智能双工交互和人-物-场景的交互。
更新于 2025-05-23北京|上海|深圳