阿里云研究型实习生 - 面向大语言模型的知识蒸馏技术研究

实习兼职阿里云研究型实习生2025-10-11地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、扎实的算法和工程能力，优良的编程风格，熟悉Python/C++语言和常用设计模式，具备复杂系统的设计开发调试能力；
2、优良的沟通表达能力、团队合作意识和经验；具备快速学习的能力，以及深入钻研技术问题的耐心；
3、熟悉计算机体系结构基础知识，…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

专注于大模型后训练，包括蒸馏+SFT/RL等相关技术，目标提升LLMs/LMMs的综合效果以及垂直场景效果，同时降低模型尺寸以减少部署成本，具体职责包括：
1、深入探索LLM蒸馏技术，对大模型进行极致的轻量化，同时尽可能减少模型的综合性能/垂直领域性能损失；
2、从数据合成、蒸馏算法等方面，提出创新优化技术，减少蒸馏带来的灾难性知识遗忘问题；
3、提出强化学习等创新方法，提升蒸馏后小模型解决复杂问题的能力，探索面向不同的复杂度任务自动调整推理模型思考长度的技术；
4、结合阿里云PAI平台产品服务，提供可靠高效的蒸馏+RL训练工具；
5、基于蒸馏+RL等后训练技术，面向Agent等LLM重点应用场景，构建业界领先的效果优化解决方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

Python+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

研究型实习生 - 面向多模态理解/交互的模型架构设计及其训练推理系统构建与优化

实习通义研究型实习生

1.负责多模态理解大模型的前沿算法研究、实现与优化，重点攻克图像/视频理解、视觉问答、跨模态交互等关键任务。 2.参与构建和清洗大规模多模态数据集，探索数据增强策略，并可能建设高效的数据生产、标注和评估 pipeline，涵盖通用数据、视频、OCR等场景。 3.具备技术前瞻性与创新能力，跟踪国际最新技术动态，探索如多模态理解创新架构、音视频理解、Agentic RAG、AI Memory等新方向，并提出创新算法或方案，推动学术前沿发展。

更新于 2025-12-02杭州|上海

研究型实习生-LLM自动评测技术

实习通义研究型实习生

背景：大语言模型（LLM）评测是LLM开发和应用中的关键环节。基于模型的自动评测技术，面向复杂任务，例如知识推理（Knowledge Reasoning）、多轮会话（Multi-tern Dialogue）、文本生成（Text generation）等，具有独特的优势，逐渐成为学术界和工业界关注的热点。涵盖技术点包括： 1. 基于裁判员模型的自动评测技术（Model-based Automatic Evaluation for LLM），涉及LLM/RL相关模型的算法设计、训练、推理等内容 2. 基于模型的自动评测框架设计，裁判员模型在不同任务和细分领域的性能优化

更新于 2024-11-14杭州

研究型实习生-面向下一代 AI 智慧医疗的高可信推理决策协同框架

实习研究型实习生

研究领域：人工智能项目简介：在医疗领域，基于大模型的医学诊疗规划和决策一直面临着医学推理能力弱（医学事实性不足）、依据不足（可信性不足）、精准个性化不够（指导性不足，存在过度医疗的伦理风险）等问题。我们旨在结合先进的大推理模型、海量的医疗数据和专业医学专家的知识，依次完成以下研究和落地： 1. 研究大模型推理理论，建设一批高水平专家 AI 诊断推理智能体。 2. 研究复杂多智能体交互协同框架。 3. 落地面向下一代的自我进化的精准诊疗规划和可信医疗决策系统。

上海|杭州

voice agent算法实习生

实习高德研究型实习生

团队介绍：高德语音技术部，是负责高德全栈语音技术的综合性团队。团队核心技术能力包括：自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景，包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。团队定位是通过前沿语音技术的研究和落地，赋能下一代AI产品创新。近期部分技术（https://arxiv.org/abs/2507.12197https://arxiv.org/abs/2507.12197）和产品进展介绍（https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg）https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHghttps://arxiv.org/abs/2507.12197）和产品进展介绍（https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg）具体职责：围绕voice agent/speech language model的研究工作，包括但不限于如下事项：跟进最领先的语音交互技术，包括但不限于提出新的技术框架、改进现有的算法、持续提升相关技术及业务指标，鼓励撰写论文及申请专利；结合业务场景，探索跨模态（文字/语音/视觉）混合训练的最佳实践，探索基于speech language model的后训练(SFT+RL)技术，持续优化交互响应、交互内容，结合规划agent/工具调用agent，持续提升voice agent的交互体验，从而反馈到高德agent的整体能力；探索流式全双工对话中，更加高效且合理的模型架构，包括但不限于COT Reasoning in streaming full-duplex等；海量的语音数据，尤其是对话数据的处理构建：定性分析、定量评估、参与设计自动评估框架，研发 scalable 的改进方案，持续提升数据质量；

更新于 2026-02-04北京