
智能互联淘宝平台事业部-智能质检标准与机制运营-大模型Agent方向
任职要求
1. 本科及以上学历,计算机、人工智能、语言学、心理学、人机交互或相关专业背景; 2. 3年以上AI产品、智能客服、内容安全或服务质量管理相关经验,有大模型/AI Agent项目落地经验者优先; 3. 深刻理解大模型(LLM)在服务场景中的能力边界与典型问题(如幻…
工作职责
1. 构建统一的智能Agent问题判定标准体系:制定适用于大模型驱动的智能Agent的通用质检原则与细粒度规则,确保跨场景一致性与可解释性拉通; 2. 设计端到端的智能质检评估指标体系:建立涵盖准确性、安全性、一致性、用户体验等维度的量化评估框架; 3. 主导高质量标注与抽检机制建设:设计打标规范、标注工具与质检流程,组织并管理专业标注团队(外包资源),通过定期抽检、bad case分析等方式,持续反哺标准优化与模型训练数据迭代。
1. 负责设计和优化大语言模型的提示词模板,提升智能对话系统的意图理解准确率和对话效果; 2. 结合具体业务场景,制定有效的提示词策略并建立测试验证机制,持续监控对话交互数据,通过A/B测试优化提示词结构,改善用户问答体验; 3. 搭建企业级提示词知识库,制定分类标注标准和方案维护标准; 4. 与算法团队紧密配合,将业务规则转化为可执行的提示词工程方案; 5. 跟踪AI领域最新进展,探索提示词优化新技术在业务场景中的应用。
1. 负责淘天商家AI智能客服产品设计,包括但不限于智能服务、人工服务、智能辅助等,把控需求价值、设计产品框架、推进功能开发、测试及上线的全流程工作,并对产品效果负责; 2. 基于数据、内外部调研和产品思考,站在业务视角深度洞察痛点和需求,诊断问题并给出系统性的解决方案,并落地成产品能力; 3. 构建有效友好的AI机器人,负责产品形态、对话体验、问题解决能力,为用户提供更高效、准确的智能客服服务。 4. 与算法及运营团队紧密协作,共同探索大模型在客服场景中的落地应用,平衡对话效果与业务需求; 5. 建立科学的产品效果评估体系,通过数据监控、用户调研与A/B测试等手段,驱动产品持续迭代与优化。
1. 负责设计和优化大语言模型的提示词模板,提升智能对话系统的意图理解准确率和对话效果; 2. 结合具体业务场景,制定有效的提示词策略并建立测试验证机制,持续监控对话交互数据,通过A/B测试优化提示词结构,改善用户问答体验; 3. 搭建企业级提示词知识库,制定分类标注标准和方案维护标准; 4. 与算法团队紧密配合,将业务规则转化为可执行的提示词工程方案; 5. 跟踪AI领域最新进展,探索提示词优化新技术在业务场景中的应用。

1. 负责淘天商家AI智能客服产品设计,包括但不限于智能服务、人工服务、智能辅助等,把控需求价值、设计产品框架、推进功能开发、测试及上线的全流程工作,并对产品效果负责; 2. 基于数据、内外部调研和产品思考,站在业务视角深度洞察痛点和需求,诊断问题并给出系统性的解决方案,并落地成产品能力; 3. 构建有效友好的AI机器人,负责产品形态、对话体验、问题解决能力,为用户提供更高效、准确的智能客服服务。 4. 与算法及运营团队紧密协作,共同探索大模型在客服场景中的落地应用,平衡对话效果与业务需求; 5. 建立科学的产品效果评估体系,通过数据监控、用户调研与A/B测试等手段,驱动产品持续迭代与优化。