logo of xiaohongshu

小红书【Hi Lab】大模型AI native算法工程师

社招全职1-3年大模型地点:上海 | 北京 | 杭州状态:招聘

任职要求


1、扎实机器学习深度学习基础,熟练掌握 PyTorch / JAX / TensorFlow 等任一框架
2、熟悉后训练常用技术(SFTRLHF / DPO / RLAIF 等)或具备相关项目 / 竞赛 / 论文经验
3、具备 实验设计与问题定位能力,能独立分析大模型在不同数据分布和任务场景下的表现
4、善于沟通和…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、Post-Training Pipeline 设计与迭代:搭建并持续优化 SFT、RM、RLHF / RLAIF / RLVF 等后训练流水线,支持多模态模型的高效迭代,让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全
2、可扩展监督与反馈系统:设计低成本人类 + AI 组合反馈机制,自动化完成偏好采集、对齐传递与数据质量评估,通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制
3、通用推理与工具使用能力提升:构建跨模态强化学习环境和多样化奖励体系,帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力
4、长期记忆、个性化与终身学习:探索持久记忆与动态偏好建模,使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力
5、安全评估与价值观对齐:搭建安全对齐机制、红队测试、越狱防御与自动化评测框架,量化模型幻觉、稳定性及价值观一致性,制定风险缓解策略,确保模型在开放场景中始终行为可控
6、跨职能落地:与产品、设计、人文训练师及数据团队,把研究成果迅速推向真实场景,打造小红书下一代战略级 AI native 应用产品
包括英文材料
机器学习+
深度学习+
PyTorch+
JAX+
TensorFlow+
SFT+
RLHF+
还有更多 •••
相关职位

logo of xiaohongshu
社招3-5年大模型

你将参与到小红书下一代 AI native 应用的构建中,通过 Omni Model 技术改变现有 AI 以文字交互为主的形态,负责全模态大模型(Omni Model)的后训练工作,主导音频与文本、视觉协同对齐的整体方案设计与落地,包括并不限于: 1、制定并迭代音频-文本-视觉对齐数据体系,与数据团队合作构建高质量、多样化、有审美的跨模态数据,并提升端到端模型的语音理解和表达能力。 2、基于 SOTA omni 基座模型,在语音、视觉、文本长序列混合后训练中,通过多种训练方法保证语音能力充分发挥的同时,又不削弱模型智商与图文表现。 3、构建语音质量与语义一致性的 Reward 模型;通过 RLHF/RLAIF/Self-Rewarding 以及 Session level RL 技术提升模型在实时对话中的语义、情绪理解能力,语音表达的自然度、逻辑一致性。 4、与工程、产品团队协同,把实验成果快速迁移到线上服务,并探索基于线上用户的语音交互反馈实现在线 RL 迭代提升。

更新于 2025-09-15北京|上海
logo of xiaohongshu
校招大模型

1、Post-Training Pipeline 设计与迭代:搭建并持续优化 SFT、RM、RLHF/RLAIF/ RLVF 等后训练流水线,支持多模态模型的高效迭代,让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全; 2、可扩展监督与反馈系统:设计低成本人类 + AI 组合反馈机制,自动化完成偏好采集、对齐传递与数据质量评估,通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制; 3、通用推理与工具使用能力提升:构建跨模态强化学习环境和多样化奖励体系,帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力; 4、长期记忆、个性化与终身学习:探索持久记忆与动态偏好建模,使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力; 5、安全评估与价值观对齐:搭建安全对齐机制、红队测试、越狱防御与自动化评测框架,量化模型幻觉、稳定性及价值观一致性,制定风险缓解策略,确保模型在开放场景中始终行为可控; 6、跨职能落地:与产品、设计、人文训练师及数据团队,把研究成果迅速推向真实场景,打造小红书下一代战略级 AI native 应用产品。

更新于 2025-09-06北京|上海
logo of xiaohongshu
社招1-3年产品运营

我们寻找热爱生活、钟情于艺术与科技交融的你,加入小红书AI性格设计师team,在追求 AI 模型在技术上的有用性基础上赋予 AI 温暖与诗意,注入灵魂,让 AI 能够为世界和人类带来美好。 1、AI 的文学与艺术表达训练:精细调校 AI 的语言风格,深入分析并优化 AI 的表达中的修辞手法、叙事结构和情感节奏,确保 AI 的语言兼具艺术美感与逻辑严谨 2、提升 AI 的多元智能水平:基于广博的人文视角和跨文化理解,萃取历史、哲学及心理学中的精华思想,塑造 AI 的底层世界观、价值观、性格和行为准则,训练 AI 在艺术审美、哲学思考、同理心等方面的能力 3、构建生动的 human-AI 交互体验:关注 human-AI 交互中的每一个细节,优化 AI 在不同情境下的回答与主动表达,让它从冷冰冰的工具转变为懂得倾听和理解你心情的温柔伙伴,用美学和智慧激发用户内心共鸣

更新于 2025-09-15上海
logo of xiaohongshu
校招大模型

大模型AI Infrastructure团队专注于大语言模型领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验,为公司提供核心技术能力和服务。 1、负责机器学习框架的研究与开发,服务于公司各个产品; 2、高效部署,优化NLP/多模态大模型核心业务模型。

更新于 2025-09-06北京|上海