logo of aliyun

阿里云研究型实习生-大语言模型知识蒸馏与模型安全研究

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


1、精通Python等语言,熟练掌握PyTorch、verl、vllm等主流训练和推理框架,具备扎实的coding能力;
2、在CCF-A国际会议或期刊(ICLR/NeurIPS/ICML/ACL等)有论文发表;
3、对解决复杂技术问题、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


聚焦于LLM后训练中知识蒸馏、模型安全、Agent等相关算法研究,具体职责包括:
1、知识蒸馏、RL算法优化与创新,不断提升LLM的reasoning能力;
2、LLM safety相关算法优化与创新,通过Guard模型构建、模型可解释性技术探索、适配模型安全领域特性的SFT/RL算法优化等,不断提升LLM的安全性;
3、Agent后训练探索与创新,提升模型在专业领域上端到端解决复杂任务的能力。
包括英文材料
Python+
PyTorch+
vLLM+
还有更多 •••
相关职位

logo of alibaba
实习淘天集团研究型实

1. 负责大模型(MLLMs/LLMs)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 负责多模态AIGC的创意玩法探索,以及细粒度可控的多模态内容生成和编辑、不同输入条件下的高质量视频生成技术研究等; 4. 基于研究成果撰写高质量学术论文,积极参与业界交流活动,建立和维护学术界与产业界的合作关系。

更新于 2025-05-06北京|杭州
logo of antgroup
实习研究型实习生

研究领域: 其他 项目简介: LLM在多个任务中已经展示了强大的能力。然而,由于现实世界的数据和需求不断变化,模型需要持续学习新知识以保持其性能。如何通过数据合成、数据增强、数据采样等多种方式,使得模型能够获取更好的知识是当前行业研究的重点和难点。以DeepSeek-R1为代表的推理模型范式为行业提供了重要启示,尤其在数学解题、代码生成、科学计算等场景中,大模型需具备从多步骤推理到最终结论生成的完整逻辑链条处理能力。研究发现,模型性能的提升已从单纯依赖参数规模扩展转向对训练数据质量的深度优化。高质量数据的稀缺性及其对模型能力的影响机理,正成为制约大模型向高阶推理跃迁的核心瓶颈。本研究旨在通过“高质量”数据与AI融合,为AIXData产业应用(包括但不限于数据标注、数据生成、CoT数据等)带来应用价值。

北京
logo of tongyi
实习通义研究型实习生

1. 探索基于大模型的语音双工交互系统关键技术,包括流式语音理解、增量文本生成、打断检测与恢复等; 2. 参与端侧轻量化语音大模型的研发,开展模型压缩(剪枝/量化/蒸馏)、硬件感知优化与高效推理引擎实现; 3. 参与设计并实现端云任务动态协同调度机制,基于网络状态、用户意图、隐私敏感度等多维上下文,智能分配计算负载,实现性能与隐私的最优平衡; 4. 参与构建支持跨端云一致性的多轮对话状态管理框架,确保长上下文语义连贯性与用户记忆的无缝衔接; 5. 参与建立面向真实场景的端云融合语音系统综合评估体系,从延迟、功耗、准确率、鲁棒性到隐私合规性等维度开展系统级测试与优化。

更新于 2025-11-21杭州
logo of aliyun
实习阿里云研究型实习

专注于大模型后训练,包括蒸馏+SFT/RL等相关技术,目标提升LLMs/LMMs的综合效果以及垂直场景效果,同时降低模型尺寸以减少部署成本,具体职责包括: 1、深入探索LLM蒸馏技术,对大模型进行极致的轻量化,同时尽可能减少模型的综合性能/垂直领域性能损失; 2、从数据合成、蒸馏算法等方面,提出创新优化技术,减少蒸馏带来的灾难性知识遗忘问题; 3、提出强化学习等创新方法,提升蒸馏后小模型解决复杂问题的能力,探索面向不同的复杂度任务自动调整推理模型思考长度的技术; 4、结合阿里云PAI平台产品服务,提供可靠高效的蒸馏+RL训练工具; 5、基于蒸馏+RL等后训练技术,面向Agent等LLM重点应用场景,构建业界领先的效果优化解决方案。

更新于 2025-10-11北京|杭州