logo of tongyi

通义AI创新事业部-多模态大模型数据评测专家-未来生活实验室

社招全职3年以上技术类-综合地点:北京 | 杭州状态:招聘

任职要求


1、本科及以上学历,影视、编导、美学设计等相关专业优先;
2、具有2年及以上大模型项目经验,作为多模态大模型的深度用户,对文生图,文生视频大模型有丰富的实际操作经验,能提供对应的AIGC生图/生视频的作品优先;
3、有较好的美学…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、评测体系建设
深入理解公司 AI 产品业务场景,结合多模态大模型技术发展趋势,设计并持续完善模型评测体系,包括评测维度、指标定义、评测流程与方法论,确保评测结果能够客观反映模型能力变化与关键问题。
2、数据与评测标准建设
负责多模态大模型训练与评测数据的质量体系建设,包括数据标注规范制定、评测标准设计及数据集构建与优化,沉淀高质量数据资产,为模型训练与评测提供可靠基础。
3、模型评测与效果分析
联合产品与算法团队开展离线评测、场景评测及对比评测,系统分析模型表现与能力边界,输出结构化评测报告,支持模型迭代与产品优化。
4、评测场景与Benchmark构建
围绕核心业务场景构建评测任务与Benchmark体系,持续扩展评测覆盖范围,确保评测体系能够真实反映用户场景与模型能力。
5、数据驱动的优化闭环与行业对标
与算法、产品和数据团队协作,通过评测定位模型问题并推动数据补充与模型优化,建立“评测—分析—优化—复评”的迭代闭环,同时持续跟踪行业评测方法与Benchmark,优化内部评测框架。
包括英文材料
学历+
大模型+
AIGC+
还有更多 •••