美团大模型数据运营-智能体方向
任职要求
1. 本科及以上学历,计算机、人工智能或相关专业背景。 2. 1年以上大模型标注/评测经验,接触过agent或智能系统应用。 3. 拥抱AI发展,实时追踪行业动态,具备良好的沟通能力和团队协作精神。 4. 强调细节并注重端到端效果,能够适应快节奏工作。 具备以下条件优先 1. 有智能体方向数据建设经验优先 2. 参与过大规模数据合成、清洗工作优先
工作职责
1. 针对不同场景智能体应用,拆解多轮、规划、插件调用等核心能力,建立评测和标注体系。 2. 主导标注人员管理与数据构建,确保数据质量和一致性,支持智能体训练、评测。 3. 设计自动化数据合成及清洗方案,实现规模化高质量数据生产。 4. 监测智能体效果,输出系统化分析报告,持续优化数据方案。
大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 1、数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。 2、语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向; 3、权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。 4、语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率 5、智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量 6、技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
1、参与AI在部门应用中的落地,重点包括AI编排平台、AI搜索、智能助手、智能客服及各类AI智能体的研发与落地,提升交互体验,降低运营成本; 2、负责大型语言模型的微调、偏好对齐、知识增强等技术探索与交付,积极跟进AIGC业内应用趋势,包括并不限于多模态、RLHF、Agent等方向,持续大提升模型的基础能力。
阿里云旗下的 Al Coding创新团队,致力于革新软件开发 paradigm。我们正在打造下一代AI驱动的智能开发工具产品,旨在彻底改变开发者的工作方式。我们的产品覆盖 Al native IDE、智能编程助手等多元化产品形态,通过尖端 AI 技术提供智能化功能和流畅体验,显著提升开发效率与创新力。我们正寻找富有激情、创造力和前瞻性思维的精英人才加入,共同定义软件开发的未来。 1.负责基于大语言模型的AI Coding产品核心能力的开发工作,实现代码续写、复杂问题分析与理解、代码生成与测试等功能,包括:代码补全、行间建议预测(NES - Next Edit Suggestion)、AI Coding智能体等; 2. 负责大模型训练相关工程与算法能力,例如模型数据合成、模型与智能体评测、与算法团队合作模型训练等工作; 3. 持续优化和改进平台架构,提高系统的可用性、稳定性和扩展性。确保全球化多地域复杂分布式架构的稳定与高性能; 4. 跟踪最新的人工智能技术进展,评估并实现可能的技术解决方案以满足业务需求; 5. 与产品经理和运营团队紧密合作,确保技术实现能够满足产品规划和用户需求,有一定项目管理经验。