logo of xiaohongshu

小红书大模型算法实习生(SFT)

实习兼职风控算法地点:上海状态:招聘

任职要求


1.在大模型SFT/RFT方向有一定经验,有相关的落地项目或比赛经历;
2.有良好的英文读写能力和扎实的数学基础,有快速学习新技术的能力;
3.有扎实的编程基础,熟悉Python/C++等编程语言,具有快速复现前沿论文的能力;
4.熟悉至少一个深度学习大模型训练框架,包括PyTorchTensorFlow、MXNet、Caffe、HuggingFace、DeepSpeed等;
5.较强的业务问题到算法模型的建模能力,有强烈的求知欲、自驱力和进取心,能及时关注和学习业界最佳实践

工作职责


拥抱LLM技术,深度改进多模态内容理解技术,应用到小红书商业化广告审核场景中来解决实际业务问题;
1.负责NLP、CV、多模态相关算法研发与落地,包括但不限于笔记图文内容结构化、文本&多模态内容理解、主题发现、信息抽取、命名实体识别、智能摘要、意图理解等;
2.进行大模型前沿技术探索和研发,包含但不限于In-context learning、SFT、RLHF、DPO等,用大模型解决实际的业务场景问题;
3.负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;
包括英文材料
大模型+
SFT+
Python+
C+++
深度学习+
PyTorch+
TensorFlow+
DeepSpeed+
算法+
相关职位

logo of xiaohongshu
实习大模型

拥抱LLM技术,深度改进智能内容生成技术,构建高效的违规样本生成系统和知识检索增强框架,应用到小红书商业化广告审核场景中来解决实际业务问题; 1.设计和开发基于大模型Agent的违规内容生成系统,构建多样化、高质量的违规样本数据集,提升模型SFT/RFT的性能上限; 2.负责构建和维护检索增强生成(RAG)案例库,包括违规案例的结构化存储、语义检索、案例匹配等,提升审核决策的准确性和可解释性; 3.进行大模型内容生成前沿技术探索和研发,包含但不限于Prompt Engineering、Few-shot Learning、Chain-of-Thought、Multi-Agent协作等;

更新于 2025-08-12
logo of liauto
实习算法

1. 参与高质量后训练数据建设及优化,覆盖车机多语言对话场景; 2. 参与大模型对齐与优化,包括SFT、RL多阶段的训练策略、数据配比等工作; 3. 参与大模型自动化评估能力建设。

logo of sensetime
社招算法工程

1.预训练、微调语言大模型,follow前沿的相关算法,开展高水平和创新性的研究,保持算法在工业界和学术界的领先,参与顶会论文投稿及专利申请; 2.进行业务落地的语言大模型算法研究,特别是在垂直领域的应用; 3.负责开发语言大模型、agent等算法所需要的工具以及基础设施,实现算法部署与工程化、文档输出; 4.负责知识库框架搭建,RAG服务的维护; 5.负责后续算法性能优化等技术细节。

更新于 2025-08-11
logo of xiaohongshu
实习大模型

1、探索下一代AI搜索范式,从底层模型架构和训练方式角度出发,研发AI搜索大模型,在推理速度,幻觉,回答准确性等方向进行突破; 2、探索新一代大语言模型基座架构,以高效推理模式为核心优化目标,探索全新模型结构和scaling law。 3、在工作中能快速成长,积极探索前沿技术,解决好业务中遇到的实际问题,完成数据处理、建模和工程上线,对AI技术始终保持热爱,实习期间可发表论文。

更新于 2025-08-19