小红书大模型算法实习生(SFT)
实习兼职风控算法地点:上海状态:招聘
任职要求
1.在大模型SFT/RFT方向有一定经验,有相关的落地项目或比赛经历; 2.有良好的英文读写能力和扎实的数学基础,有快速学习新技术的能力; 3.有扎实的编程基础,熟悉Python/C++等编程语言,具有快速复现前沿论文的能力; 4.熟悉至少一…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
拥抱LLM技术,深度改进多模态内容理解技术,应用到小红书商业化广告审核场景中来解决实际业务问题; 1.负责NLP、CV、多模态相关算法研发与落地,包括但不限于笔记图文内容结构化、文本&多模态内容理解、主题发现、信息抽取、命名实体识别、智能摘要、意图理解等; 2.进行大模型前沿技术探索和研发,包含但不限于In-context learning、SFT、RLHF、DPO等,用大模型解决实际的业务场景问题; 3.负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
实习ACG
-灵活使用PostPretrain/SFT/DPO/RL等,理解客户需求场景,设计针对性的特色解决方案 -探索Agent自动化编排调度,尝试业务落地 -跟进并探索前沿的模型范式,研究样本质量 数量对模型效果的影响,摸索更高效、低成本的蒸馏方案,研究RL在特定需求场景下的适用性 -结合CV/NLP等传统深度学习模型、多模态大模型,解决实际场景问题 -深刻理解模型训练、推理的性能瓶颈,通过底层优化提升训练、推理性能
更新于 2025-10-28北京|上海|成都
实习大模型
拥抱LLM技术,深度改进智能内容生成技术,构建高效的违规样本生成系统和知识检索增强框架,应用到小红书商业化广告审核场景中来解决实际业务问题; 1.设计和开发基于大模型Agent的违规内容生成系统,构建多样化、高质量的违规样本数据集,提升模型SFT/RFT的性能上限; 2.负责构建和维护检索增强生成(RAG)案例库,包括违规案例的结构化存储、语义检索、案例匹配等,提升审核决策的准确性和可解释性; 3.进行大模型内容生成前沿技术探索和研发,包含但不限于Prompt Engineering、Few-shot Learning、Chain-of-Thought、Multi-Agent协作等;
更新于 2025-10-21上海
