logo of tongyi

通义研究型实习生-大语言模型的科学推理能力增强

实习兼职通义研究型实习生地点:北京 | 杭州状态:招聘

任职要求


1.计算机及相关专业的博士或硕士研究生;
2.对LLM
登录查看完整任职要求
微信扫码,1秒登录

工作职责


大模型的科学知识和文本推理能力是体现大模型智能程度的重要标准,而如何通过大规模算力显著提高大模型的相关能力目前仍是亟待被探索的。本项目旨在研究通过相关预训练数据挖掘合成、专项post-training优化、reward模型构建等技术提升大模型的专项能力并进一步反哺给通用模型。
拟解决的技术问题包括但不限于:
-科学、文本推理类预训练数据的高效挖掘、构建
-科学、文本推理类数据的大规模自动合成
-科学、文本推理类能力的自动评测建设
-科学、文本推理类能力的post-training专项优化
-科学、文本推理类能力的reward model专项优化
包括英文材料
大模型+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 大语言模型近年来在自然语言处理领域取得了显著进展,但在处理高难度数学问题和复杂编程任务时,仍面临着推理能力不足和精度不够的问题。数学和代码问题通常涉及深层次的逻辑推理、符号推导和多步骤的推理过程,而这些任务要求模型能够准确地理解并生成符合数学或编程逻辑的解答。本课题旨在研究如何提升大语言模型在高难度数学推理和代码生成方面的能力,尤其是增强其对复杂问题的理解、推理和解决过程。通过创新的技术手段,本课题希望能够推动模型在这些领域的应用和实用性,进一步拓展大语言模型的应用边界。

北京|杭州|成都
logo of tongyi
实习通义研究型实习生

随着大语言模型(LLM)在自然语言处理中的推理能力不断提升,越来越多的研究开始关注其在代码领域的应用。本项目聚焦于提升大语言模型在代码生成、代码修复以及代码推理等方面的表现。为了进一步优化模型的性能,本项目将采用强化学习(RL)技术,通过自我反馈和动态调整来提高模型在复杂代码任务中的理解与生成能力。 我们专注于解决以下关键技术问题: 1. 面向代码的推理数据构建:我们将开发面向代码合成的数据集,设计代码推理链,并探索可扩展的监督学习方法,为强化学习模型提供高质量的输入数据。 2. 面向代码的强化学习策略:我们将设计更高效的训练算法,并探索强化学习在人类反馈(RLHF)和人工智能反馈(RLAIF)领域的应用,以优化模型在代码生成与修复任务中的表现。

更新于 2024-10-14北京|杭州
logo of amap
实习高德研究型实习生

团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责: 1. 协助语音大模型的数据构建,搭建高效高质的语音数据生产Pipeline 和数据标准,优化Pipeline算子,用高质量数据提升技术预研和业务落地的效果; 2. 参与语音大模型的端到端评测,搭建科学敏捷的评测Pipeline和评测标准,用全面真实的评测推动模型效果优化提升; 3. 深度理解对话交互、音视频创作的技术和产品趋势,设计与业务目标贴合的数据与评测方案;与团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据标注/评测效率;

更新于 2025-12-09北京
logo of amap
实习高德研究型实习生

团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责: 1. 协助语音大模型的数据构建,搭建高效高质的语音数据生产Pipeline 和数据标准,优化Pipeline算子,用高质量数据提升技术预研和业务落地的效果; 2. 参与语音大模型的端到端评测,搭建科学敏捷的评测Pipeline和评测标准,用全面真实的评测推动模型效果优化提升; 3. 深度理解对话交互、音视频创作的技术和产品趋势,设计与业务目标贴合的数据与评测方案;与团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据标注/评测效率;

更新于 2025-12-09北京