极飞科技AI训练师(J10954)
任职要求
1.有丰富的专业写作、文案撰写、论文撰写经验; 2.具备优秀的内容理解和文本撰写能力,有较好的逻辑和独立判断的思维,能够清晰、准确地传达信息和想法; 3.具备信息整合和共情能力强,案头研究、专家…
工作职责
1.负责农业科技产品知识数据开发运营全流程,包括数据收集、知识数据整理、知识数据撰写、优化、更新、扩充等; 2.借助相关工具或开发代码/脚本,对知识数据做批量整理、优化、扩充等; 3.基于知识数据相关工作,与相关团队协同,努力提升AI产品的效果和用户体验; 4.了解 AI 相关技术和评测方法,建立知识数据和AI产品效果的评估体系,重点关注知识数据对 AI 产品效果的提升; 5.建立知识数据标准、知识更新、知识核验、版本管理等标准化流程规范,提升知识数据管理效率,确保知识数据的质量和准确性; 6.完成上级安排的其他工作任务。
该岗位的主要职责包括构建和优化基于AI的大模型链路,通过系统化整理业务知识,提升模型能力的质量及覆盖率,从而增强大模型的理解和应用能力。此外,需与技术团队合作,确保应用的可用性和持续更新,并搭建模型测评标准,确保机器人在会话召回准确率等关键指标上达到预定目标。通过科学评估和监控机制,持续优化模型性能,实现召回准确率提升,同时关注采纳率和知识库查看率等指标,全面提升知识库和大模型的实际应用效果。 具体工作内容主要包括: 1. 探索和提炼业务大模型知识库的结构化构建方式,不断迭代更新版本,确保大模型和人工均能有效使用,实现知识库的全面覆盖。 2. 搭建模型测评标准,确保机器人在会话召回准确率等关键指标上达到目标水平。 3. 建立模型适用文档,对不同的基座模型进行全方位测评,评估每个模型在不同场景、环节、应用方式等方面的优势和劣势。 4. 负责客服场景对话能力的搭建,提升场景闭环率,并将需要搭建的能力提交给工具运营以推进。 5.通过设计、优化和测试AI模型的提示词(Prompt)、知识库,提升智能体输出的准确性、逻辑性和用户体验。 6. 使用低代码平台(如扣子类产品)进行基于语言模型的智能体应用开发。
该岗位的主要职责包括构建和优化基于AI的金融客服知识库,通过系统化整理金融知识,提升知识库的质量和覆盖率,从而增强大模型的理解和应用能力。此外,需与技术团队合作,确保知识库的可用性和持续更新,并搭建模型测评标准,确保机器人在会话召回准确率等关键指标上达到预定目标。通过科学评估和监控机制,持续优化模型性能,实现召回准确率提升,同时关注采纳率和知识库查看率等指标,全面提升知识库和大模型的实际应用效果。 具体工作内容主要包括: 1. 探索和提炼金融大模型知识库的结构化构建方式,不断迭代更新版本,确保大模型和人工均能有效使用,实现知识库的全面覆盖。 2. 搭建模型测评标准,确保机器人在会话召回准确率等关键指标上达到目标水平。 3. 建立模型适用文档,对不同的基座模型进行全方位测评,评估每个模型在不同场景、环节、应用方式等方面的优势和劣势。 4. 负责客服场景对话能力的搭建,提升场景闭环率,并将需要搭建的能力提交给工具运营以推进。 5.通过设计、优化和测试AI模型的提示词(Prompt)、知识库,提升智能体输出的准确性、逻辑性和用户体验。 6. 使用低代码平台(如扣子类产品)进行基于语言模型的智能体应用开发。
负责对基于大模型构建的通用垂类应用进行效果和质量评估;通过与产品研发团队的紧密合作,制定评估标准和体系,准确分析评估效果,为应用的优化和改进提供支持,以提升应用的性能、用户体验和市场竞争力; 应用效果与质量评估: 1)负责评估基于大语言模型构建的通用垂类应用的效果和质量,包括但不限于语言理解准确性、生成内容的合理性、逻辑连贯性、知识准确性等方面; 2)参与设计测试用例,涵盖不同场景、用户需求和输入条件,以确保应用在各种情况下的稳定性和可靠性; 3)参与收集和分析用户反馈数据,结合实际使用情况,对应用的性能和用户体验进行综合评估; 评估标准与体系建设: 1)理解业务需求和产品目标,与产品研发团队密切沟通和协作,负责制定详细、明确的评估标准和指标体系; 2)理解评估数据的收集、整理和分析流程,确保评估数据的完整性和可靠性,为评估体系的持续改进提供数据支持; 评估效果分析与报告:撰写评估报告,清晰阐述评估方法、过程、结果和结论,为产品研发团队提供决策依据和改进方向。