蚂蚁金服蚂蚁集团-算法工程师-大模型数据认知方向
任职要求
● 计算机科学、人工智能、深度学习或相关领域的硕士及以上学历。 ● 熟练掌握PyTorch、Tensorflow 等深度学习框架,理解大模型训练数据的需求,熟悉模型数据的链路, ● 优秀的定义、分析、解决问题的能力,自我驱动,具备较强的学习、创新应用和沟通协调能力,problem-solver 以下情况优先考虑: ● 有大模型数据体系设计、语料分类、评测集建设、数据标注算法等相关项目的实践经验者优先。曾参与过大型数据集构建或数据质量评估工作的候选人优先考虑; ● 有大模型、智能体、强化学习、数据标注算法等相关技术领域工作经验者优先; ● 拥有计算机视觉、自然语言处理、人工智能相关领域的顶级会议论文发表,或者在相关算法竞赛中获得top排名者优先。
工作职责
大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 ● 数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。 ● 语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向; ● 权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。 ● 语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率 ● 智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量 ● 技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。
大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 1、数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。 2、语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向; 3、权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。 4、语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率 5、智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量 6、技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。
1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力; 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平; 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。
1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化
1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。