阿里云研究型实习生 - 大语言模型推理优化

实习兼职阿里云研究型实习生2024-07-12地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

研究探索大预言模型模型的推理服务的新方法，产出高水平…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

本项目主要关注大语言模型的部署环节，以解决大语言模型推理框架中的如下技术问题： 1. 优化单服务实例的性能和成本：配合前沿模型压缩算法探索高性能算子的前沿方向、创新注意力算子（Attention）实现方式、通过编译优化等手段提升模型推理性能；结合大语言模型服务的场景特性，创新请求调度算法，优化用户体验和系统吞吐；结合算法创新，采用上下文稀疏、投机采样等方法加速解码（Decoding）过程。 2. 异构硬件适配：以编译技术为基础，探索统一的跨平台优化方法，能敏捷地完成主流的GPU/CPU/NPU等硬件的适配，并在各个平台提供较高的性能。 3. 探索云上单租户多服务、多租场景下的混合部署方法，将不同尺寸、不同访问频度、不同优先级的模型混合部署在异构资源池中，并保证SLA。通过请求调度方法的创新、资源共享方法创新，降低总体部署成本、提升资源利用率和弹性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

相关职位

研究型实习生-大模型稳定高效训练探索

实习通义研究型实习生

1.探索基于数据驱动的高效后训练优化策略，以更高效地提升模型性能，降低计算资源的消耗。 2.探索推理路径优化方法，提高大语言模型在多步推理、逻辑推理及跨领域知识融合任务中的准确性，稳定性和可控性。 3.探索推理能力自适应提升技术，开发能够根据具体任务需求动态调整推理策略的自适应学习机制，使模型在不同场景下都能达到较高的推理效率和准确率。

更新于 2025-04-11北京|杭州

研究型实习生-大语言模型的科学推理能力增强

实习通义研究型实习生

大模型的科学知识和文本推理能力是体现大模型智能程度的重要标准，而如何通过大规模算力显著提高大模型的相关能力目前仍是亟待被探索的。本项目旨在研究通过相关预训练数据挖掘合成、专项post-training优化、reward模型构建等技术提升大模型的专项能力并进一步反哺给通用模型。拟解决的技术问题包括但不限于： -科学、文本推理类预训练数据的高效挖掘、构建 -科学、文本推理类数据的大规模自动合成 -科学、文本推理类能力的自动评测建设 -科学、文本推理类能力的post-training专项优化 -科学、文本推理类能力的reward model专项优化

更新于 2024-09-03北京|杭州

研究型实习生 - 面向大语言模型的知识蒸馏技术研究

实习阿里云研究型实习

专注于大模型后训练，包括蒸馏+SFT/RL等相关技术，目标提升LLMs/LMMs的综合效果以及垂直场景效果，同时降低模型尺寸以减少部署成本，具体职责包括： 1、深入探索LLM蒸馏技术，对大模型进行极致的轻量化，同时尽可能减少模型的综合性能/垂直领域性能损失； 2、从数据合成、蒸馏算法等方面，提出创新优化技术，减少蒸馏带来的灾难性知识遗忘问题； 3、提出强化学习等创新方法，提升蒸馏后小模型解决复杂问题的能力，探索面向不同的复杂度任务自动调整推理模型思考长度的技术； 4、结合阿里云PAI平台产品服务，提供可靠高效的蒸馏+RL训练工具； 5、基于蒸馏+RL等后训练技术，面向Agent等LLM重点应用场景，构建业界领先的效果优化解决方案。

更新于 2025-10-11北京|杭州

阿里妈妈-广告引擎异构计算研发实习生

实习淘天集团研究型实

1. 跟进GPU范式下向量化召回的极致优化、大语言模型（LLM）推理加速优化、异构硬件优化技术，跟进搜推广引擎架构GPU范式设计和落地； 2. 基于前沿调研和团队输入，优化落地海量物料供给下的GPU向量化召回、召回引擎业务逻辑异构计算抽象和落地、LLM推理延时/吞吐优化； 3. 结合上述研究和具体工作，撰写技术文章，和业界、学界形成良好交流。

更新于 2025-05-06北京