腾讯混元3D数字人动作算法研究员
任职要求
1. 具有计算机视觉或图形学相关方向的硕士或博士学位,有独立思考和算法突破的能力; 2.对深度学习相关理论有深入的理解,对常用的深度学习框架有丰富的经验,熟悉Diffusion Model, Transformer等技术; 3. 在3D人体动作驱动方向有相关经验,包括说话人动作驱动、动作过渡、动作捕捉、动作生成等方向; 4. 有游戏业务落…
工作职责
1.参与和推进3D数字人动作驱动算法研发,包括说话人动作驱动、动作过渡、动作捕捉、动作生成等方向。
1.联合模型团队,主导设计图像、视频、3D等模态的美学标准制定,包括风格定义、色彩规范、材质设计等,确保跨模态视觉风格统一性; 2.建立模型效果验收体系,通过定量与定性多种方式,评估优化生成质量,并根据评测结果补充底模训练集,不断优化底模效果,持续提升AIGC风格质量及效率和稳定性; 3.结合业务场景(如营销、游戏等)设计多风格模型需求,推动LoRA等定制化模型训练与工程化落地; 4.关注AI绘画、数字艺术领域的前沿动态,配合模型团队,把握目标用户对 Al绘画/视频/3D等相关产品的诉求,输出风格策划执行方案,配合模型探索多模态前沿技术在各类场景中的应用,实现技术转化; 5.熟悉如ComfyUI等工作流搭建及模型工程化落地,包括但不限于图片、视频、3D;不断调优ComfyUI工作流节点及相关参数,提升最终AIGC输出效果;精通lora模型训练,支持业务目标完成多风格多类型的定制模型需求; 6.负责美术及设计团队管理,统筹分工,包括视觉设计师、3D模型师、技术美术(TA)等角色,制定任务优先级并监督执行。
1.负责图像、视频、3D或音频等某一AIGC方向的产品规划与全生命周期管理; 2.深度洞察用户需求与技术趋势,定义具有竞争力的产品能力矩阵和发展路线图; 3.建立科学的模型评估与迭代机制,确保产品效果的持续领先; 4.协调内外部资源,推动产品从概念到上线、优化及商业化落地的全过程。
1.负责多模态模型(生图/生视频/生3D)/策略效果送代,设计满足用户体验的理想态回复标准,并驱动数据生产和模型训练,达成体验/能力优化目标; 2.与上下游模型算法、工程技术、标注交付等团队紧密合作,输出标注需求,完成策略送代,共同推进模型效果提升和产品化目标达成; 3.负责设计和制定完善的策略评估体系,输出评测需求,与评测团队配合,通过科学的评估方式定位问题并推动优化; 4.设计多模态模型效果评估体系,推进系统化的效果反馈,质量监控,打造数据飞轮。