logo of wondershare

万兴科技AI美学评测工程师

社招全职1年以上地点:长沙状态:招聘

任职要求


必备条件:
1、有 1年以上视觉设计 / 图像创作 / CG 艺术 / 插画方向经验;
2、 熟悉 Stable Diffusion、DALL·E、Midjourney 等图像生成工具;
3、对图像美学有…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 执行图像生成效果的评估任务,包括图文一致性评分、融合度判断、美学等主观打分与评测记录;
2. 按风格类型与任务类型等组织评估测试样本;
3. 标注图像缺陷类型,如面部异常、图文一致性不足等问题;
4. 协助产品完成算法迭代相关版本的图像任务打分、测试集构建、样本清洗等流程;
5. 维护评估数据集标签规范、主观评价一致性、数据可追踪性。
包括英文材料
Stable Diffusion+
还有更多 •••
相关职位

logo of mihoyo
社招程序&技术类

岗位职责: 1. 参与多模态视频生成模型的 Prompt 体系构建,负责 Prompt 模板设计、参数调优与效果验证; 2. 基于大模型(LLM)生成 caption、tagging、场景描述等内容,为视频数据打标或生成优化提供语义支撑; 3. 编写代码(Python / Node.js / Shell 等)实现 Prompt 的批量实验、自动化测试与结果分析; 4. 与算法团队协作,基于定量指标(如时序一致性、角色稳定性、文本匹配度等)进行优化评估; 5. 分析模型生成日志与视频输出,定位问题并提出针对性 Prompt 调整方案; 6. 参与数据清洗、Prompt 模板版本管理与 Prompt–生成–评测的全流程自动化建设。

上海
logo of antgroup
社招3年以上技术类-算法

1. 负责深度学习、生成式模型在图像与视频生成领域的研发与优化,包括文本生成图像(text-to-image)、文本生成视频(text-to-video)、图像/视频编辑等。 2. 研究并实现前沿的生成模型架构(如 Diffusion Models、GAN、Transformer、NeRF 等)以及多模态融合技术(文本、音频、视频、图像)。 3. 结合业务需求,设计和训练高质量的生成模型,提升生成结果的真实感、美学质量、语义一致性和可控性。 4. 建立数据采集与清洗流程,构建高质量的训练、微调和评估数据集(涵盖图像、视频、多模态)。 5. 设计、实现并维护模型推理服务,包括模型部署、性能优化、成本控制和稳定性保障。 6. 对生成模型的评测指标进行研究和完善,包括自动化评分、用户反馈收集、强化学习奖励函数等。 7. 跟进计算机视觉、生成式AI、多模态领域业界及学术新技术,并快速验证和落地。

更新于 2025-12-05北京|杭州
logo of kuaishou
社招3-5年D13912

1、产品战略与规划: 深入洞察AIGC行业趋势、用户需求和竞争格局,负责AI图像生成模型及相关应用功能(Web & App)的中长期产品规划和迭代路线图; 2、核心功能与体验设计: 负责AI图像生成核心功能的完整生命周期,通过提升模型的可控性、表现力和易用性,系统性地优化用户创作体验,并探索与定义前沿的AI原生交互模式; 3、一体化工作流构建: 规划并推动图像与视频生成工作流的深度整合方案,打造连贯、高效的一体化创作体验,构建平台的核心竞争壁垒; 4、模型效果定义与驱动: 与算法团队紧密协作,将用户场景和产品需求,转化为清晰、可量化的模型效果评估标准。通过建立评测体系和反馈闭环,持续驱动算法模型在美学、可控性、真实感等方面的迭代精进; 5、数据驱动与用户洞察: 深度挖掘用户行为数据,结合定性/定量的用户研究和A/B测试,科学地评估产品表现,精准洞察用户核心意图与痛点,发现增长机会并驱动产品决策; 6、跨团队协同与项目管理: 作为项目核心,高效地与算法、工程、设计、运营、法务等团队沟通协作,确保产品高质量、按时交付,并达成预期的业务和数据目标。

更新于 2025-09-02北京
logo of tencent
社招3年以上TEG设计

1.联合模型团队,主导设计图像、视频、3D等模态的美学标准制定,包括风格定义、色彩规范、材质设计等,确保跨模态视觉风格统一性; 2.建立模型效果验收体系,通过定量与定性多种方式,评估优化生成质量,并根据评测结果补充底模训练集,不断优化底模效果,持续提升AIGC风格质量及效率和稳定性; 3.结合业务场景(如营销、游戏等)设计多风格模型需求,推动LoRA等定制化模型训练与工程化落地; 4.关注AI绘画、数字艺术领域的前沿动态,配合模型团队,把握目标用户对 Al绘画/视频/3D等相关产品的诉求,输出风格策划执行方案,配合模型探索多模态前沿技术在各类场景中的应用,实现技术转化; 5.熟悉如ComfyUI等工作流搭建及模型工程化落地,包括但不限于图片、视频、3D;不断调优ComfyUI工作流节点及相关参数,提升最终AIGC输出效果;精通lora模型训练,支持业务目标完成多风格多类型的定制模型需求; 6.负责美术及设计团队管理,统筹分工,包括视觉设计师、3D模型师、技术美术(TA)等角色,制定任务优先级并监督执行。

更新于 2025-07-03深圳