小红书基础大模型算法专家

社招全职3-5年大模型2026-06-03地点：上海 | 北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、背景： 计算机、电子、数学等相关专业硕士/博士；深入理解大模型训练、推理和数据构建流程； -
2、专业深耕：在预训练（数据配比，模型结构，AI Infra）、SFT（e.g. 数据合成、拒绝采样）、强化学习（e.g. Reward Model，GRPO/PPO） 或 模型推理（e.g. 投机解码）等领域有…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、预训练：模型架构设计和实现，持续打磨多阶段预训练技巧，结合自动化和人工筛选，持续迭代化数据配比方案（质量、类别分布、难度等），训练全尺寸Dense和MoE模型，以及探索Hybrid架构、Diffusion训练/推理等新一代大模型范式； 
2、后训练：SFT数据合成、拒绝采样、数据配比、模型训练，样本级标签体系建设，RL数据合成、Reward Model设计、router replay、RL算法创新，显著提升alignment阶段模型生成能力； 
3、数据&评测：持续改进数据体系pipeline，包括：数据收集、清洗、去重和配比等，合成各种高质量agentic/reasoning训练数据，提升模型通用能力；持续完善大模型评估体系和Bench，能有效评估STEM、math、code、知识、指令跟随、多语言等维度能力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

SFT+

强化学习+

PyTorch+

Megatron+

SGLang+

还有更多 •••

登录查看完整学习资料