logo of alibaba

阿里巴巴研究型实习生 - 纯文本及多模态大模型advanced reasoning能力研究

实习兼职阿里巴巴研究型实习生地点:北京 | 杭州状态:招聘

任职要求


1. 熟悉Python语言和PyTorch框架,有大模型research经验,熟悉GRPO、PPO、蒸馏等大模型训练算法,熟悉多模态大模型。
2. 扎实的工程能力,优良的编程风格,具备复杂系统的设计开发调试能力。
3. 优良的沟通表达能力、团队合作意识和经验;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


基于开源大模型,探索在长链路复杂任务或多模态知识密集型任务上更强的reasoning能力,推进前沿开源技术。具体职责包括:
1. 探索纯文本大模型或多模态大模型在RLVR(GRPO等)、知识蒸馏等训练算法基础上advance reasoning的潜力。
2. 探索并提升大模型在工具调用、复杂场景上的能力上限。
3. 参与开源大模型训练框架的开发,并将research产出开源在魔搭社区上。
包括英文材料
Python+
PyTorch+
还有更多 •••