通义AI创新事业部-多模态大模型数据评测专家-未来生活实验室
社招全职3年以上技术类-综合地点:北京 | 杭州状态:招聘
任职要求
1、本科及以上学历,影视、编导、美学设计等相关专业优先; 2、具有2年及以上大模型项目经验,作为多模态大模型的深度用户,对文生图,文生视频大模型有丰富的实际操作经验,能提供对应的AIGC生图/生视频的作品优先; 3、有较好的美学…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、评测体系建设 深入理解公司 AI 产品业务场景,结合多模态大模型技术发展趋势,设计并持续完善模型评测体系,包括评测维度、指标定义、评测流程与方法论,确保评测结果能够客观反映模型能力变化与关键问题。 2、数据与评测标准建设 负责多模态大模型训练与评测数据的质量体系建设,包括数据标注规范制定、评测标准设计及数据集构建与优化,沉淀高质量数据资产,为模型训练与评测提供可靠基础。 3、模型评测与效果分析 联合产品与算法团队开展离线评测、场景评测及对比评测,系统分析模型表现与能力边界,输出结构化评测报告,支持模型迭代与产品优化。 4、评测场景与Benchmark构建 围绕核心业务场景构建评测任务与Benchmark体系,持续扩展评测覆盖范围,确保评测体系能够真实反映用户场景与模型能力。 5、数据驱动的优化闭环与行业对标 与算法、产品和数据团队协作,通过评测定位模型问题并推动数据补充与模型优化,建立“评测—分析—优化—复评”的迭代闭环,同时持续跟踪行业评测方法与Benchmark,优化内部评测框架。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
AIGC+
https://ui.adsabs.harvard.edu/abs/2023arXiv230406632W/abstract
To address the challenges of digital intelligence in the digital economy, artificial intelligence-generated content (AIGC) has emerged.
还有更多 •••