小红书【Hi Lab】AI人文训练师-大模型
任职要求
1、文理兼修:曾受过心理学/哲学/文学/历史/艺术等方向的专业训练,有顶级的文科素养,同时有较好的逻辑思维能力与批判性思维习惯,能够在捕捉细腻情感与抽象思考间游刃有余; 2、有较好的文字功底:对文字表达有足够的敏感,擅长通过文字表达自己的思想并感染他人…
工作职责
我们寻找热爱生活、钟情于艺术与科技交融的你,加入小红书AI性格设计师team,在追求 AI 模型在技术上的有用性基础上赋予 AI 温暖与诗意,注入灵魂,让 AI 能够为世界和人类带来美好。 1、AI 的文学与艺术表达训练:精细调校 AI 的语言风格,深入分析并优化 AI 的表达中的修辞手法、叙事结构和情感节奏,确保 AI 的语言兼具艺术美感与逻辑严谨 2、提升 AI 的多元智能水平:基于广博的人文视角和跨文化理解,萃取历史、哲学及心理学中的精华思想,塑造 AI 的底层世界观、价值观、性格和行为准则,训练 AI 在艺术审美、哲学思考、同理心等方面的能力 3、构建生动的 human-AI 交互体验:关注 human-AI 交互中的每一个细节,优化 AI 在不同情境下的回答与主动表达,让它从冷冰冰的工具转变为懂得倾听和理解你心情的温柔伙伴,用美学和智慧激发用户内心共鸣
我们寻找热爱生活、钟情于艺术与科技交融的你,加入小红书AI性格设计师team,在追求 AI 模型在技术上的有用性基础上赋予 AI 温暖与诗意,注入灵魂,让 AI 能够为世界和人类带来美好。 1、AI 的文学与艺术表达训练:精细调校 AI 的语言风格,深入分析并优化 AI 的表达中的修辞手法、叙事结构和情感节奏,确保 AI 的语言兼具艺术美感与逻辑严谨 2、提升 AI 的多元智能水平:基于广博的人文视角和跨文化理解,萃取历史、哲学及心理学中的精华思想,塑造 AI 的底层世界观、价值观、性格和行为准则,训练 AI 在艺术审美、哲学思考、同理心等方面的能力 3、构建生动的 human-AI 交互体验:关注 human-AI 交互中的每一个细节,优化 AI 在不同情境下的回答与主动表达,让它从冷冰冰的工具转变为懂得倾听和理解你心情的温柔伙伴,用美学和智慧激发用户内心共鸣
1、Post-Training Pipeline 设计与迭代:搭建并持续优化 SFT、RM、RLHF / RLAIF / RLVF 等后训练流水线,支持多模态模型的高效迭代,让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全 2、可扩展监督与反馈系统:设计低成本人类 + AI 组合反馈机制,自动化完成偏好采集、对齐传递与数据质量评估,通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制 3、通用推理与工具使用能力提升:构建跨模态强化学习环境和多样化奖励体系,帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力 4、长期记忆、个性化与终身学习:探索持久记忆与动态偏好建模,使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力 5、安全评估与价值观对齐:搭建安全对齐机制、红队测试、越狱防御与自动化评测框架,量化模型幻觉、稳定性及价值观一致性,制定风险缓解策略,确保模型在开放场景中始终行为可控 6、跨职能落地:与产品、设计、人文训练师及数据团队,把研究成果迅速推向真实场景,打造小红书下一代战略级 AI native 应用产品
1、Post-Training Pipeline 设计与迭代:搭建并持续优化 SFT、RM、RLHF/RLAIF/ RLVF 等后训练流水线,支持多模态模型的高效迭代,让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全; 2、可扩展监督与反馈系统:设计低成本人类 + AI 组合反馈机制,自动化完成偏好采集、对齐传递与数据质量评估,通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制; 3、通用推理与工具使用能力提升:构建跨模态强化学习环境和多样化奖励体系,帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力; 4、长期记忆、个性化与终身学习:探索持久记忆与动态偏好建模,使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力; 5、安全评估与价值观对齐:搭建安全对齐机制、红队测试、越狱防御与自动化评测框架,量化模型幻觉、稳定性及价值观一致性,制定风险缓解策略,确保模型在开放场景中始终行为可控; 6、跨职能落地:与产品、设计、人文训练师及数据团队,把研究成果迅速推向真实场景,打造小红书下一代战略级 AI native 应用产品。
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对 AI 技术有信仰的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的智能技术。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态,以未来几年 AI 技术的质变突破为目标。 岗位说明:你会负责下述至少一件事情 1.海量的多模态数据处理:定性分析、定量评估数据质量,并给出 scalable 的改进方案,协助搭建多模态的数据流程; 2.搭建多模态的模型架构,在多种技术方案中找到 trade off 的关键,搭建更高效且可扩展的模型框架 3.研究并改进多模态模型的 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等)