快手多模态大模型算法实习生
实习兼职D13918地点:杭州状态:招聘
任职要求
1、计算机科学与技术、人工智能等相关专业的硕士或博士; 2、2年内计算机多模态/NLP/CV相关工作经验,有较强的coding能力; 3、热衷于通用大模型及新兴技术领域,具备独立开发尖端模型的能力,且拥有在NLP、CV、ML顶尖会议或期刊上发表研究成果的经历者将获得优先考虑; 4、有良好的数学和编程基础,熟悉至少一种深度学习框架(如 TensorFlow、PyTorch); 5、具备良好的沟通能力和团队合作精神。
工作职责
1、跟踪、探索大模型方向/多模态预训练方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性; 2、多模态大模型结构的设计、训练任务的规划、预训练流程以及下游功能的开发等。
包括英文材料
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
相关职位
实习策略算法
1、基于大模型等前沿技术,构建多模态内容理解模型,并应用到小红书多模态搜索来解决实际业务问题 2、进行大模型前沿技术探索和研发,发表国际顶级论文 3、参与多模态大模型相关的业务落地,包括但不限于笔记图文/视频多模态内容理解、视频结构化、多模态意图理解等
更新于 2025-05-24
实习高德研究型实习生
我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。 主要职责 1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。 3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。 4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。
更新于 2025-07-29
实习
1、负责小米汽车智能座舱内的大语言模型和多模态大语言模型的研究、开发、部署和性能优化; 2、与各职能团队团队紧密协作,参与产品设计和算法模型落地到车载芯片的相关工作; 3、跟踪新能源汽车行业动态,探索在汽车领域的应用场景和落地。
更新于 2025-01-22