蚂蚁金服蚂蚁集团-算法工程师-大模型数据认知方向

社招全职技术类-算法2025-06-18地点：杭州状态：招聘

扫码手机上打开

任职要求

● 计算机科学、人工智能、深度学习或相关领域的硕士及以上学历。 
● 熟练掌握PyTorch、Tensorflow 等深度学习框架，理解大模型训练数据的需求，熟悉模型数据的链路，
● 优秀的定义、分析、解决问题的能力，自我驱动，具备较强的学习、创新应用和沟通协调能力，problem-solver

以下情况优先考虑：
● 有大…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

大模型数据认知方向，负责设计和开发先进的算法，解决大模型数据生产中的关键问题，包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向
● 数据知识体系生成： 研究基于LLM的自动知识图谱生成技术，设计并实现自动化算法，构建高效、可扩展的大模型数据知识体系。 
● 语料自动分类： 基于数据知识体系，研究和开发语料分类算法，指导大模型数据的拓展方向； 
● 权威评测集建设： 研究业界现有评测集的缺陷，构建标准化、多样化的权威评测集，用于评估大模型的性能； 与跨职能团队合作，确保评测集覆盖全面且具有代表性。 
● 语料质量评估与合成： 建立大模型训练的数据驱动体系，开发语料质量评估算法，识别低质量或噪声数据。 研究数据驱动的语料合成技术，基于模型的评测效果，针对性合成能够改进模型效果的训练语料，提升模型迭代效率 
● 智能标注链路研发: 基于大模型数据的标注需求，研发辅助打标算法； 设计构建 AI辅助的标注质量检验与标注提效的算法链路，提升人工标注的质检效率与标注质量 
● 技术创新与优化： 持续跟踪学术界和工业界的最新研究成果，探索前沿技术在大模型数据中的应用。 针对实际业务需求，提出创新性的解决方案并快速落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

学历+

PyTorch+

TensorFlow+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-算法工程师-大模型数据智能

社招3年以上风险管理-风险策

大模型数据认知方向，负责设计和开发先进的算法，解决大模型数据生产中的关键问题，包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 1、数据知识体系生成：研究基于LLM的自动知识图谱生成技术，设计并实现自动化算法，构建高效、可扩展的大模型数据知识体系。 2、语料自动分类：基于数据知识体系，研究和开发语料分类算法，指导大模型数据的拓展方向； 3、权威评测集建设：研究业界现有评测集的缺陷，构建标准化、多样化的权威评测集，用于评估大模型的性能；与跨职能团队合作，确保评测集覆盖全面且具有代表性。 4、语料质量评估与合成：建立大模型训练的数据驱动体系，开发语料质量评估算法，识别低质量或噪声数据。研究数据驱动的语料合成技术，基于模型的评测效果，针对性合成能够改进模型效果的训练语料，提升模型迭代效率 5、智能标注链路研发: 基于大模型数据的标注需求，研发辅助打标算法；设计构建 AI辅助的标注质量检验与标注提效的算法链路，提升人工标注的质检效率与标注质量 6、技术创新与优化：持续跟踪学术界和工业界的最新研究成果，探索前沿技术在大模型数据中的应用。针对实际业务需求，提出创新性的解决方案并快速落地。

更新于 2025-09-09杭州

算法工程师（大模型）

实习虎鲸文娱2026

1、负责大模型在query深度理解（语义推理/意图识别/实体识别/文本纠错）、多语言翻译等方向的算法突破，持续提升生成质量与任务泛化能力； 2、设计LLM的规划-推理-反思技术闭环，研发复杂任务拆解、因果推断、自我纠错等能力，通过思维链（CoT）优化和自洽性增强提升模型高阶认知水平； 3、基于优酷搜索场景数据提供技术解决方案，探索业界前沿技术在业务中的落地与指标优化。

更新于 2025-05-06北京|杭州

算法工程师（大模型）

校招虎鲸文娱2026

1、负责大模型在query深度理解（语义推理/意图识别/实体识别/文本纠错）、多语言翻译等方向的算法突破，持续提升生成质量与任务泛化能力 2、设计LLM的规划-推理-反思技术闭环，研发复杂任务拆解、因果推断、自我纠错等能力，通过思维链（CoT）优化和自洽性增强提升模型高阶认知水平 3、基于优酷搜索场景数据提供技术解决方案，探索业界前沿技术在业务中的落地与指标优化

更新于 2025-12-16北京|杭州

算法工程师-大模型应用

实习淘天集团2026

1. 大模型驱动的算法革新： a. 参与大模型（LLM、多模态大模型）在电商核心场景（搜索、推荐、广告、多智能体对话等）中的算法创新与应用； b. 研究大模型与经典搜推广模型的融合方案，提升模型效果与用户体验； 2. 下一代AI系统构建： a. 通过分布式训练、模型压缩、低延迟推理等技术，面向工业级应用完成千亿级参数大模型的高效训练与部署； b. 尝试生成式AI、多智能体协作等前沿方向，推动AI技术在电商领域的创新应用； 3. 大模型在亿级用户规模落地的实战： a. 直面淘宝数亿用户、百亿级行为数据的挑战，落地大模型应用； b. 参与双11、618等顶级电商场景的算法优化，见证大模型技术驱动商业增长的完整链路。

更新于 2025-07-09北京|杭州