logo of quark

千问千问事业部-大模型产品Agentic评测运营-北/杭

社招全职3年以上运营类-内容运营地点:北京 | 杭州状态:招聘

任职要求


1. 有1年以上大语言模型评测、AI产品质量评估或相关领域工作经验优先
2. 深入理解大语言模型的能力边界与常见评测范式,具备独立设计完整评测方案的能力
3. 熟悉Age…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


一、核心职责:
1. 产品迭代评估方案与用户满意度量化
2. 跟随千问APP产品能力迭代节奏,针对新功能、新场景制定对应的评估方案和评分标准,明确评估维度和指标,并选择最合适的评估方法(自动评测、人工评估、众测、A/B实验等),兼顾效率与准确性;
3. 建立人工评估结果与线上众测数据、实验指标(留存率、使用率、满意度评分等)的对齐机制,确保离线评估结论能有效预测线上用户体验,将主观体验转化为可追踪、可对比的量化指标,支撑产品决策;
包括英文材料
AI agent+