logo of antgroup

蚂蚁金服蚂蚁集团-算法工程师-大模型数据智能

社招全职3年以上风险管理-风险策略运营地点:杭州状态:招聘

任职要求


1、计算机科学、人工智能、深度学习或相关领域的硕士及以上学历。
2、熟练掌握PyTorchTensorflow深度学习框架,理解大模型训练数据的需求,熟悉模型数据的链路,
3、优秀的定义、分析、解决问题的能力,自我驱动,具备较强的学习、创新应用和沟通协调能力,problem-solver

以下情况优先考虑:
1、有大模型数据体系设计、语料分类、评测集建设、数据标注算法等相关项目的实践经验者优先。曾参与过大型数据集构建或数据质量评估工作的候选人优先考虑;
2、有大模型智能体强化学习、数据标注算法等相关技术领域工作经验者优先;
3、拥有计算机视觉自然语言处理、人工智能相关领域的顶级会议论文发表,或者在相关算法竞赛中获得top排名者优先。

工作职责


大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向
1、数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。
2、语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向;
3、权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。
4、语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率
5、智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量
6、技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。
包括英文材料
深度学习+
学历+
PyTorch+
TensorFlow+
大模型+
算法+
强化学习+
OpenCV+
NLP+
智能体+
相关职位

logo of nio
校招算法

项目内容介绍: 人工智能和大模型数据智能服务项目。主要分为以下两个方向: 1、GPT应用平台场景,打造企业级一站式大模型平台,提供先进的生成式AI生产及应用全流程开发工具链;支持了公司辅助营销、智能客服等众多智能化应用。 2、整车行业智能化场景的解决方案,包括;研发和生产数字化、数字化营销和服务等。 - 通过先进的数据分析和人工智能算法,实现生产资源的优化配置和生产流程的精细化管理; - 通过AI检测提高产品质量、提升生产效率、降低生产成本以及优化生产工艺; - 通过AI的数据挖掘和分析,为产品设计、制造、测试等环节提供决策支持; - 通过AI辅助生成营销文案,处理大量的客户咨询和服务请求,降低运营成本,提高效率等。 职位描述: 1. 深入参与公司在大模型、深度学习等前沿领域的研究和开发工作; 2. 负责关键算法的设计、实现与优化,解决技术难题,提升产品性能; 3. 与产品、工程团队紧密合作,确保项目的顺利推进; 4. 跟踪业界最新学术论文与技术动态,进行技术预研和储备,为公司的发展提供有力支持;

更新于 2025-07-29
logo of nio
实习算法

项目内容介绍: 人工智能和大模型数据智能服务项目。主要分为以下两个方向: 1、GPT应用平台场景,打造企业级一站式大模型平台,提供先进的生成式AI生产及应用全流程开发工具链;支持了公司辅助营销、智能客服等众多智能化应用。 2、整车行业智能化场景的解决方案,包括;研发和生产数字化、数字化营销和服务等。 - 通过先进的数据分析和人工智能算法,实现生产资源的优化配置和生产流程的精细化管理; - 通过AI检测提高产品质量、提升生产效率、降低生产成本以及优化生产工艺; - 通过AI的数据挖掘和分析,为产品设计、制造、测试等环节提供决策支持; - 通过AI辅助生成营销文案,处理大量的客户咨询和服务请求,降低运营成本,提高效率等。 职位描述: 1. 深入参与公司在大模型、深度学习等前沿领域的研究和开发工作; 2. 负责关键算法的设计、实现与优化,解决技术难题,提升产品性能; 3. 与产品、工程团队紧密合作,确保项目的顺利推进; 4. 跟踪业界最新学术论文与技术动态,进行技术预研和储备,为公司的发展提供有力支持;

更新于 2025-07-29
logo of antgroup
社招技术类-算法

大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 ● 数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。 ● 语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向; ● 权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。 ● 语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率 ● 智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量 ● 技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。

更新于 2025-06-18
logo of bytedance
社招A180560A

1、负责大模型数据智能平台的核心研发,构建多模态标注、合成数据生成和高质量数据蒸馏系统,同时深入研究大模型工作原理并探索创新应用场景; 2、主导大模型应用的构建全过程,从需求分析、模型设计到开发实现与优化,确保数据平台的高效性与准确性,持续调优模型性能; 3、通过数据分析与算法改进,优化大模型数据供应链(标注、合成、蒸馏),提升模型效果和用户体验,并与跨部门团队协作推动项目落地; 4、关注行业前沿技术,引入创新算法理念,为数据平台的技术发展提供前瞻性建议,特别是在代码生成、模型对齐与持续学习等领域的应用突破。

更新于 2025-04-16