阿里巴巴研究型实习生 - 纯文本及多模态大模型advanced reasoning能力研究
实习兼职阿里巴巴研究型实习生地点:北京 | 杭州状态:招聘
任职要求
1. 熟悉Python语言和PyTorch框架,有大模型research经验,熟悉GRPO、PPO、蒸馏等大模型训练算法,熟悉多模态大模型。 2. 扎实的工程能力,优良的编程风格,具备复杂系统的设计开发调试能力。 3. 优良的沟通表达能力、团队合作意识和经验;…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
基于开源大模型,探索在长链路复杂任务或多模态知识密集型任务上更强的reasoning能力,推进前沿开源技术。具体职责包括: 1. 探索纯文本大模型或多模态大模型在RLVR(GRPO等)、知识蒸馏等训练算法基础上advance reasoning的潜力。 2. 探索并提升大模型在工具调用、复杂场景上的能力上限。 3. 参与开源大模型训练框架的开发,并将research产出开源在魔搭社区上。
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••