阿里云研究型实习生 - 基于大模型预训练的推荐场景多模态建模技术研究
实习兼职阿里云研究型实习生地点:北京 | 杭州状态:招聘
任职要求
• 计算机科学、人工智能、数据科学等相关专业博士或硕士,有在国际顶级会议或期刊上发表相关领域论文的经历者优先。 • 深入了解多模态微调和训练,以及自监督训练相关的模型,如CLIP, DINO, InternVL, QWen-VL等,有实际项目经验者优先。 • 熟悉推荐系统的常见模型如DIN, SIM等,对推荐多模态相关模型如SIMTIER等有研究者优先。 • 熟练使用TensorFlow, PyTorch等深度学习框架,具备较强的编程能力和分析能力。 • 实习时间至少六个月。
工作职责
多模态大模型与推荐系统的结合应用是当前业界前沿的研究方向,旨在通过结合多模态大模型和用户行为数据来提升推荐系统的性能。阿里云人工智能平台(PAI)团队正致力于这一领域的探索与实践,以解决跨场景推荐、冷启动等问题,提高推荐模型在行为数据稀疏场景下的表现。我们的研究和开发方向包括但不限于: 1. 多模态大模型与行为数据的融合:研究多模态大模型(如图像、文本等)与用户行为数据结合的微调训练方法,探索最佳的数据融合策略。 2. 特征对齐:探索新的建模方式,实现多模态特征与用户行为特征之间的对齐,确保模型能够充分利用多种类型的数据提升推荐效果。 3. 推荐模型的优化:在现有推荐模型的基础上,引入多模态特征,优化推荐算法,特别是在冷启动和跨场景推荐等挑战性场景下,提升推荐效果。
包括英文材料
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
推荐系统+
[英文] Recommender Systems
https://www.d2l.ai/chapter_recommender-systems/index.html
Recommender systems are widely employed in industry and are ubiquitous in our daily lives.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
相关职位
实习淘天集团研究型实
1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术。 2. 研发基于大模型的生成式召回、广告点击率预估、用户搜索词理解等下游应用。 3. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
更新于 2025-08-11
实习淘天集团研究型实
1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术; 2. 跟进多模态的大模型(vLLM)预训练、SFT、RLHF等技术; 3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
更新于 2025-07-04
实习淘天集团研究型实
1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术; 2. 跟进多模态的大模型(vLLM)预训练、SFT、RLHF等技术; 3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
更新于 2025-05-06