小红书多模态算法实习生
实习兼职内容理解地点:北京状态:招聘
任职要求
1. 计算机科学、电子、数学、统计学等相关专业,本科学历及以上; 2. 具有扎实的机器学习基础,对CV/多模态技术、NLP技术、GPT类技术有深入的理解,数理功底扎实,自学能力强; 3. 有扎实的编码能力,熟练使用相关机器学习框架和工程框架。对Hadoop和Spark技术有深入的理解和实践经验,能够高效…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 参与超大规模通用多模态场景数据处理的开发和模型性能提升,研究内容包括但不限于:1)小红书笔记、评论等场景 2)互联网通用场景 3)各种垂类场景; 2. 有机会参与到构建全链路多模态数据流算法中(采集、处理、清洗、训练、推理、评估); 3. 追踪全球范围内最前沿的多模态数据相关技术,有效凝练算法并应用在数据处理环节中; 4. 在具有挑战性的研究问题上不断深耕并达到业界顶尖水平。
包括英文材料
学历+
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
NeurIPS+
https://neurips.cc/
还有更多 •••
相关职位
实习技术类
1.深入开展内容安全治理多模态大模型的调研工作,跟踪前沿技术发展趋势,分析不同模型在该场景下的适用性。 2.协助团队进行多模态大模型的训练工作,包括数据预处理、模型搭建、参数调整等,以提升模型在内容审核任务上的准确性和效率。 3.参与模型性能评估,分析实验结果,提出改进方案,优化模型性能。 4.与其他团队成员协作,共同解决在多模态模型应用于内容审核业务过程中遇到的技术问题。
更新于 2025-06-09上海
实习D3336
1、负责研发基于diffusion的low-level视频处理算法,专注于提升算法性能,包括但不限于网络架构设计(VAE和DIT)、算法优化、大规模数据处理以及Diffusion模型保真性提升; 2、负责研发基于diffusion的视频压缩和生成框架,致力于突破视频生成极限,涉及图像/视频压缩算法的创新设计和优化; 3、负责跟进和探索业界前沿视频修复技术,并根据业务需求进行创新和性能提升。
更新于 2025-08-06北京
实习AIGC算法
【岗位亮点】 顶会论文直通车:我们鼓励并全力支持你将研究成果发表到CVPR、NeurIPS等顶级会议,资深技术人员全程指导,算力充足。 核心业务组:智能创作发布,直接影响用户体验,专注于将前沿多模态大模型、AIGC 技术与小红书发布核心业务深度融合。转正机会大。 前沿探索与创新:聚焦多模-态大模型(MLLMs)前沿,在 多模态指令微调、多模态检索、个性化文案生成、RAG 等方向中选择你最擅长或最感兴趣的,提出并实现你的创新想法。 从想法到落地:负责从算法设计、实验验证到模型优化的全流程,用严谨的实验和数据说话,推动研究课题取得突破。
更新于 2025-09-05北京
