小红书【REDstar】Hi Lab-Post-Training算法工程师

校招全职2026-03-28地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，计算机等相关专业方向优先；
2、扎实机器学习与深度学习基础，熟练掌握PyTorch / JAX / TensorFlow等任一框架；
3、熟悉后训练常用技术（SFT、RLHF / DPO / RLAIF 等）或具备相关项目 / 竞赛 / 论文经验；
4、具备实验设计与问题定位能力，能独立分析大模型在不同数据分布和任务场景下的表…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、Post-Training Pipeline 设计与迭代：搭建并持续优化 SFT、RM、RLHF/RLAIF/ RLVF 等后训练流水线，支持多模态模型的高效迭代，让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全；
2、可扩展监督与反馈系统：设计低成本人类 + AI 组合反馈机制，自动化完成偏好采集、对齐传递与数据质量评估，通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制；
3、通用推理与工具使用能力提升：构建跨模态强化学习环境和多样化奖励体系，帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力；
4、长期记忆、个性化与终身学习：探索持久记忆与动态偏好建模，使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力；
5、安全评估与价值观对齐：搭建安全对齐机制、红队测试、越狱防御与自动化评测框架，量化模型幻觉、稳定性及价值观一致性，制定风险缓解策略，确保模型在开放场景中始终行为可控；
6、跨职能落地：与产品、设计、人文训练师及数据团队，把研究成果迅速推向真实场景，打造小红书下一代战略级 AI native 应用产品。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

深度学习+

PyTorch+

TensorFlow+

SFT+

大模型+

ICML+

还有更多 •••

登录查看完整学习资料

相关职位

【REDstar】Hi Lab-视觉语言大模型算法工程师

校招

参与视觉语言大模型的研发工作，主要负责： 1、VIT Pretrain：提升模型感知能力，包括但不限于 Vision Encoder Pretrain 算法架构 / 多种感知能力数据构建； 2、VLM Pretrain：提升 vlm pretrain 的通用能力，探索各种不同训练阶段设计 / 不同通用数据的组织形式； 3、VLM Post train：提升 vlm 通用能力，包括但不限于合成数据 / RL 等方法； 4、生成理解统一：探索生成理解统一架构，同时提升理解和生成能力。

更新于 2026-03-28北京|上海

【REDstar】Hi Lab-大语言模型基础技术研究员

校招

文本大模型团队的主要负责小红书大语言模型的端到端全链路自研。主要研究方向包括: 1、持续探索大语言模型在不同阶段的高效scaling策略； 2、预训练的关键技术探索: 包括从数据策略(筛选，配比，合成，学习效率的提升)、优化技术、可解释性，到下一代模型结构的设计、long context建模、学习范式探索等； 3、通用alignment技术探索: 包括大规模RL的探索，持续提升大模型在通用能力、reasoning、长文本、agent、各方向中长尾知识等多个方向的综合能力，支撑更广泛的应用场景； 4、跟下游的多模态同学一起探索端到端全模态大模型的设计和高效scaling策略；团队有充足的GPU计算资源，同时跟整个技术社区也有密切合作，开源开放。

更新于 2026-03-28北京|上海

【REDstar】Hi Lab-语音端到端交互大模型算法工程师

校招

参与端到端语音交互大模型的研发工作，主要负责： 1、搭建端到端交互模型架构，探索不同潜在可能性，找出更优的方案，在智商/情商/延迟/成本上达到平衡； 2、持续优化数据pipeline，提升数据质量，在千万小时数据上挖掘金矿； 3、全面提升语音理解能力，包括但不限于ASR/说话人识别/情感等富语言信息； 4、优化模型TTS效果，持续优化tokenizer，提升合成效果。

更新于 2026-03-28北京|上海

【REDstar】Hi Lab-大模型高性能计算工程师- AI infra

校招

大模型AI Infrastructure团队专注于大语言模型领域的前沿技术研究和落地，提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验，为公司提供核心技术能力和服务。 1、负责机器学习框架的研究与开发，服务于公司各个产品； 2、高效部署，优化NLP/多模态大模型核心业务模型。

更新于 2026-03-28北京|上海