小红书【REDstar】Alignment算法工程师
任职要求
1、本科及以上学历,计算机等相关专业优先; 2、具备扎实的机器学习理论基础,能够熟练使用至少一种深度学习框架(如 PyTorch、Jax、TensorFlow、MindSpore、PaddlePaddle),并具备在复杂应用场景下应用这些工具的实践经验; 3、深入理解监督学习、强化学习、表示学习等方法,并在至少一个 AI 领域有过研究经历或通过机器学习算法成功解决过复杂问题; 4、具备设计复杂实验和分析实验结果的能力,能够识别并解决模型在真实应用中的关键技术挑战,具备创新思维,并能够有效沟通、与团队协作。
工作职责
1、参与语言及多模态大模型的对齐技术研究与优化,聚焦于解决模型在复杂指令遵循、推理、幻觉、工具使用等问题中的表现瓶颈,提升模型的实用性与可靠性; 2、研究并理解模型能力与对齐之间的关系,探索更有效的对齐技术,包括可扩展的人类监督方法等,设计并执行复杂的理解性实验,分析大模型在不同数据分布和任务场景下的表现,发现并解决影响模型性能的关键问题; 3、开发和完善大模型的评测系统,对模型能力和对齐水平进行评测,识别并解决模型可能存在稳定性、安全和幻觉问题,利用多种方法分析、理解模型行为,并指导模型进行迭代; 4、与产品、工程、安全团队紧密合作,将研究成果有效落地,确保模型应用符合实际需求,并在关键技术上做到行业顶尖水平。
1、Post-Training Pipeline 设计与迭代:搭建并持续优化 SFT、RM、RLHF/RLAIF/ RLVF 等后训练流水线,支持多模态模型的高效迭代,让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全; 2、可扩展监督与反馈系统:设计低成本人类 + AI 组合反馈机制,自动化完成偏好采集、对齐传递与数据质量评估,通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制; 3、通用推理与工具使用能力提升:构建跨模态强化学习环境和多样化奖励体系,帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力; 4、长期记忆、个性化与终身学习:探索持久记忆与动态偏好建模,使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力; 5、安全评估与价值观对齐:搭建安全对齐机制、红队测试、越狱防御与自动化评测框架,量化模型幻觉、稳定性及价值观一致性,制定风险缓解策略,确保模型在开放场景中始终行为可控; 6、跨职能落地:与产品、设计、人文训练师及数据团队,把研究成果迅速推向真实场景,打造小红书下一代战略级 AI native 应用产品。
文本大模型团队的主要负责小红书大语言模型的端到端全链路自研。主要研究方向包括: 1、持续探索大语言模型在不同阶段的高效scaling策略; 2、预训练的关键技术探索: 包括从数据策略(筛选,配比,合成,学习效率的提升)、优化技术、可解释性,到下一代模型结构的设计、long context建模、学习范式探索等; 3、通用alignment技术探索: 包括大规模RL的探索,持续提升大模型在通用能力、reasoning、长文本、agent、各方向中长尾知识等多个方向的综合能力,支撑更广泛的应用场景; 4、跟下游的多模态同学一起探索端到端全模态大模型的设计和高效scaling策略; 团队有充足的GPU计算资源,同时跟整个技术社区也有密切合作,开源开放。
1、负责小红书搜广推多场景召回与排序模型优化,提升时长、互动、留存等核心指标; 2、核心技术方向包括:LLM应用于推荐系统,基于搜广推全域信号打通的图神经网络预训练模型,深度进化学习应用于全系统参数自动搜索,多模态在召回/排序等模块的应用等技术方向;在小红书独特的双列社区产品形态下,探索最适合社区产品的种草拔草全链路建模范式; 3、业务落地场景包括:双列推荐/展示/搜索/电商广告的模型,用户/资源冷启动,重排和多资源混排场景等。