通义AI创新事业部-多模态大模型数据评测专家-未来生活实验室

社招全职3年以上技术类-综合2026-07-03地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，影视、编导、美学设计等相关专业优先；
2、具有2年及以上大模型项目经验，作为多模态大模型的深度用户，对文生图，文生视频大模型有丰富的实际操作经验，能提供对应的AIGC生图/生视频的作品优先；
3、有较好的美学…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、评测体系建设
深入理解公司 AI 产品业务场景，结合多模态大模型技术发展趋势，设计并持续完善模型评测体系，包括评测维度、指标定义、评测流程与方法论，确保评测结果能够客观反映模型能力变化与关键问题。
2、数据与评测标准建设
负责多模态大模型训练与评测数据的质量体系建设，包括数据标注规范制定、评测标准设计及数据集构建与优化，沉淀高质量数据资产，为模型训练与评测提供可靠基础。
3、模型评测与效果分析
联合产品与算法团队开展离线评测、场景评测及对比评测，系统分析模型表现与能力边界，输出结构化评测报告，支持模型迭代与产品优化。
4、评测场景与Benchmark构建
围绕核心业务场景构建评测任务与Benchmark体系，持续扩展评测覆盖范围，确保评测体系能够真实反映用户场景与模型能力。
5、数据驱动的优化闭环与行业对标
与算法、产品和数据团队协作，通过评测定位模型问题并推动数据补充与模型优化，建立“评测—分析—优化—复评”的迭代闭环，同时持续跟踪行业评测方法与Benchmark，优化内部评测框架。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

AIGC+

还有更多 •••

登录查看完整学习资料