logo of tencent

腾讯混元多模态美学专家

社招全职3年以上TEG设计地点:深圳状态:招聘

任职要求


1.本科及以上学历,设计/艺术类相关专业,3年以上AIGC/游戏/影视行业经验;主导过完整多模态项目(如3D虚拟角色、AI短视频生成);
2.审美能力突出,对构图、色彩、风格有敏锐把控力,能够为模型或业务场景提供有创意的设计方案;
3.有人像写真/图像/3D材质生成等复杂场景实战经验,精调编辑工作流搭建经验;具备完成一套完整工作流设计的能力,精通AI类工具,设计软件;
4.对AI技术有强烈热情,擅长跨团队沟通,有带小团队经验,具备技术方案拆解与项目管理能力。

工作职责


1.联合模型团队,主导设计图像、视频、3D等模态的美学标准制定,包括风格定义、色彩规范、材质设计等,确保跨模态视觉风格统一性;
2.建立模型效果验收体系,通过定量与定性多种方式,评估优化生成质量,并根据评测结果补充底模训练集,不断优化底模效果,持续提升AIGC风格质量及效率和稳定性;
3.结合业务场景(如营销、游戏等)设计多风格模型需求,推动LoRA等定制化模型训练与工程化落地;
4.关注AI绘画、数字艺术领域的前沿动态,配合模型团队,把握目标用户对 Al绘画/视频/3D等相关产品的诉求,输出风格策划执行方案,配合模型探索多模态前沿技术在各类场景中的应用,实现技术转化;
5.熟悉如ComfyUI等工作流搭建及模型工程化落地,包括但不限于图片、视频、3D;不断调优ComfyUI工作流节点及相关参数,提升最终AIGC输出效果;精通lora模型训练,支持业务目标完成多风格多类型的定制模型需求;
6.负责美术及设计团队管理,统筹分工,包括视觉设计师、3D模型师、技术美术(TA)等角色,制定任务优先级并监督执行。
包括英文材料
学历+
相关职位

logo of tencent
社招2年以上AI技术

1.数据特征算法:负责海量文本&多模态数据(图像,视频,音频,3D)的内容理解(如分类标签体系、embedding表征、Caption生成等),质量检测(低质识别检测、优质美学评价等),去重/聚类分析,数据合成等算法; 2.数据pipeline建设:负责数据采集、筛选清洗、标注与质量评估pipeline的建设。与模型业务团队紧密配合,充分分析挖掘数据资源,建立自动化数据处理流程与机制,支持模型持续迭代; 3.数据实验分析:对模型训练数据进行详细分析,建立科学数据实验机制,识别样本不足、质量问题、配比不均衡等潜在问题,驱动数据优化提升数据覆盖、质量、多样性需求,最终带来大模型生成效果的持续提升。

更新于 2025-10-15
logo of tencent
社招3年以上TEG产品

1.负责混元多模态(生图、生视频等)等平台型产品Agent建设,基于对AIGC市场洞察和对混元模型能力的理解,联动模型团队,将模型能力提炼成基础应用能力,赋能前端各类业务场景的应用; 2.深入理解前端业务在图形生成、视频生成、创意制作等领域的场景和需求,通过对前端需求的洞察,抽象提炼对基础模型的要求,牵引模型持续进行基础能力的迭代、优化。

更新于 2025-06-16
logo of tencent
社招3年以上TEG产品

1.负责多模态模型(生图/生视频/生3D)/策略效果送代,设计满足用户体验的理想态回复标准,并驱动数据生产和模型训练,达成体验/能力优化目标; 2.与上下游模型算法、工程技术、标注交付等团队紧密合作,输出标注需求,完成策略送代,共同推进模型效果提升和产品化目标达成; 3.负责设计和制定完善的策略评估体系,输出评测需求,与评测团队配合,通过科学的评估方式定位问题并推动优化; 4.设计多模态模型效果评估体系,推进系统化的效果反馈,质量监控,打造数据飞轮。

更新于 2025-06-16
logo of tencent
社招TEG技术

1.多模态驱动引擎开发,通过对文本/语音/视觉等信息,构建虚拟人表情、动作的驱动大模型; 2.设计多模态条件生成框架,实现语音、表情、镜头、肢体动作的联合优化; 3.开发多模态特征同步技术:语音-表情时序对齐、文本语义-镜头运动关联建模。

更新于 2025-05-30