小红书大模型算法实习生
实习兼职大模型地点:上海状态:招聘
任职要求
1.在大模型数据生成、SFT等方向有一定经验,有相关的落地项目或比赛经历; 2.有良好的英文读写能力和扎实的数学基础,有快速学习新技术的能力; 3.有扎实的编程基础,熟悉Python/C++等编程语言,具有快速复现前沿论文的能力; 4.熟悉至少一个深度学习和大模型训练框架,包括PyTorch、TensorFlow、MXNet、Caffe、HuggingFace、DeepSpeed等; 5.较强的业务问题到算法模型的建模能力,有强烈的求知欲、自驱力和进取心,能及时关注和学习业界最佳实践
工作职责
拥抱LLM技术,深度改进智能内容生成技术,构建高效的违规样本生成系统和知识检索增强框架,应用到小红书商业化广告审核场景中来解决实际业务问题; 1.设计和开发基于大模型Agent的违规内容生成系统,构建多样化、高质量的违规样本数据集,提升模型SFT/RFT的性能上限; 2.负责构建和维护检索增强生成(RAG)案例库,包括违规案例的结构化存储、语义检索、案例匹配等,提升审核决策的准确性和可解释性; 3.进行大模型内容生成前沿技术探索和研发,包含但不限于Prompt Engineering、Few-shot Learning、Chain-of-Thought、Multi-Agent协作等;
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
MXNet+
https://www.tutorialspoint.com/apache_mxnet/index.htm
Apache MXNet is a powerful deep learning framework that supports both symbolic and imperative programming.
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
实习网易有道
参与前沿大模型算法的研发与落地应用,方向包括但不限于:智能 Agent、Deep Research、多模态大模型、检索增强生成 (RAG) 等; 紧跟领域最新技术动态,探索创新算法方法,并积极推动科研成果的产出; 参与技术方案讨论、算法设计与实现、模型训练与优化等研发工作,保证项目进度和研发质量; 持续学习和掌握最新的大模型相关技术,并应用于实际产品和项目中,解决实际问题。
更新于 2025-06-18
实习内容理解
工作职责: 1. 真实业界数据的处理分析:定性分析、定量评估数据质量、对数据采集和处理方案不断优化改进; 2. 模型开发:参与Qwen、Llama等开源LLM的训练微调、量化和部署实践,追踪业内前沿,达到领先的性能指标; 3. 结合小红书丰富的工业场景,根据实际业务需求进行技术落地和创新。
更新于 2025-09-23
实习大模型
1、探索下一代AI搜索范式,从底层模型架构和训练方式角度出发,研发AI搜索大模型,在推理速度,幻觉,回答准确性等方向进行突破; 2、探索新一代大语言模型基座架构,以高效推理模式为核心优化目标,探索全新模型结构和scaling law。 3、在工作中能快速成长,积极探索前沿技术,解决好业务中遇到的实际问题,完成数据处理、建模和工程上线,对AI技术始终保持热爱,实习期间可发表论文。
更新于 2025-08-19