美团大模型数据运营-智能体方向
任职要求
1. 本科及以上学历,计算机、人工智能或相关专业背景。 2. 1年以上大模型标注/评测经验,接触过agent或智能系统应用。 3. 拥抱AI发展,实时追踪行业动态,具备良好的…
工作职责
1. 针对不同场景智能体应用,拆解多轮、规划、插件调用等核心能力,建立评测和标注体系。 2. 主导标注人员管理与数据构建,确保数据质量和一致性,支持智能体训练、评测。 3. 设计自动化数据合成及清洗方案,实现规模化高质量数据生产。 4. 监测智能体效果,输出系统化分析报告,持续优化数据方案。
大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 1、数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。 2、语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向; 3、权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。 4、语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率 5、智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量 6、技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
1.AI素材生产体系搭建:基于AI Agent搭建自动化素材生产管线,覆盖视频理解、生成与编辑等核心场景,推动AI规模化素材产出在增长业务中稳定落地; 2.高转化策略抽象化:深度拆解高转化素材的视听语言(镜头、运镜、节奏等),将其转化为可复用的提示词策略与Agent工作流,持续提升素材转化效率; 3.素材效果评测体系:建立“内容质量+投放效果”量化评估体系,通过多维度评估输出质量评分与优化建议,对增长素材的最终产出质量负责; 4.规模化质量保障:针对生成链路中的幻觉、风格不一致等问题,设计有效的策略,确保批量生产内容的稳定性与可用性。 5.跨团队协同:整合算法(提示词/模型应用)、设计(审美把控)、运营(反馈迭代)等资源,推动增长项目高效落地。
1、产品战略与愿景定义:基于市场趋势与客户痛点,独立负责AI Agent产品的战略规划与愿景设计,清晰定义产品核心价值主张与路线图(产品路径图); 2、全链路产品设计与迭代:负责从需求分析、用户研究、信息架构设计到高保真原型产出的全流程;重点设计Agent的执行引擎抽象、插件化架构交互、多租户安全体系等产品体验,确保技术可行性与业务价值的统一; 3、To B企业级产品落地:深度参与AI产品在生产环境的特性设计,包括安全合规、权限控制、生命周期管理、监控告警、容错机制等,确保产品满足企业级客户的严苛要求; 4、技术与业务桥梁构建:作为业务、研发、市场三方的核心纽带,准确翻译业务需求为技术语言,驱动研发团队高效交付,并对产品上线后的数据表现与用户反馈进行持续迭代优化; 5、行业方案与商业化赋能:结合垂类行业(如私域运营、客户服务等)场景,沉淀标准化的AI Agent产品解决方案,参与售前方案设计与客户成功,推动产品商业化。