千问千问事业部-大模型产品Agentic评测运营-北/杭
社招全职3年以上运营类-内容运营地点:北京 | 杭州状态:招聘
任职要求
1. 有1年以上大语言模型评测、AI产品质量评估或相关领域工作经验优先 2. 深入理解大语言模型的能力边界与常见评测范式,具备独立设计完整评测方案的能力 3. 熟悉Age…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
一、核心职责: 1. 产品迭代评估方案与用户满意度量化 2. 跟随千问APP产品能力迭代节奏,针对新功能、新场景制定对应的评估方案和评分标准,明确评估维度和指标,并选择最合适的评估方法(自动评测、人工评估、众测、A/B实验等),兼顾效率与准确性; 3. 建立人工评估结果与线上众测数据、实验指标(留存率、使用率、满意度评分等)的对齐机制,确保离线评估结论能有效预测线上用户体验,将主观体验转化为可追踪、可对比的量化指标,支撑产品决策;
包括英文材料
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.