通义研究型实习生-多语言多模态表征技术研究
实习兼职通义研究型实习生地点:北京 | 杭州状态:招聘
任职要求
1. 候选人应为计算机及相关专业的博士或硕士研究生; 2. 熟练使用PyTorch框架进行深度学习模型训练与优化; 3. 拥有扎实的编程基础和出色的工…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
RAG是当前大语言模型实际应用中的核心技术之一。RAG链路中,Embedding和ReRank是两个关键模块。本项目主要面向多语言多模态表征技术方向的研究。研究课题主要包括: 1. 持续探索适配多语言文本、多模态表示及排序模型的最佳预训练架构、预训练方法和SFT策略; 2. 持续探索加速模型迭代效率的方案,例如大模型数据合成、模型融合策略等方案; 3. 探索多模态RAG、LLM驱动的新型搜索方案。
包括英文材料
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
信息检索+
https://nlp.stanford.edu/IR-book/information-retrieval-book.html
Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
还有更多 •••
相关职位
实习通义研究型实习生
专注于多模态通用运动表征技术的研究,具体职责包括: 1、构建一个多模态大模型框架,能够对现有多媒体素材中运动信息进行学习,输出在特定类目/物品在指定环境下运动规律的个性化表征; 2、基于上述运动表征,能够恢复、迁移到指定类目及场景下的运动效果,生成对应的视频素材; 3、模型能够拓展到通用物体场景,包含刚性/非刚性物体、被动/主动运动物体、相机视角变化/主体运动; 4、负责算法研发过程中的数据构建工作。
更新于 2025-05-08北京|杭州
实习大模型
【职位描述】 我们是小红书安全风控平台部/算法策略组/内容安全组,目前专注于多模态大模型在多模态理解和内容安全场景的技术落地和产品预研,目前在相关数据&技术方向有一定的积累,并将长期持续投入。我们希望寻求优秀在读硕士生/博士生共同突破大模型在安全审核行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于: 1. 基础多模态表征:主要研究小红书多模态数据(笔记)下的基础多模态表征工作,包括层次化表征、特征融合、自监督探索等,作为基础模型,支持多样化检索场景。 2. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括高效微调、多模态理解等。建立安全多模态基础模型。
北京
实习淘天集团研究型实
1. 掌握和跟进LLM、MLLM、aigc等前沿技术的发展动态; 2. 结合业务需求,深入研究aigc细节生成技术,构建攻防算法系统; 3. 结合业务需求,探索细粒度多模态表征技术,以及局部检索技术; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
更新于 2025-05-06杭州