小红书【Ace顶尖实习生】面向千人千面agent的广告大模型能力构建

校招全职策略算法2026-07-27地点：北京 | 上海 | 杭州状态：招聘

扫码手机上打开

任职要求

1、不限年级，本科及以上在读，计算机/人工智能/软件工程等相关专业优先；
2、扎实的编程能力和算法功底，熟练掌握Python/C++/Java等至少一种编程语言；
3、扎实的机器学习/深度学习理论基础，有大规…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

随着广告系统从“流量匹配”向“深度理解”演进，传统的模型范式在面对用户动态变化的兴趣与复杂决策场景时，逐渐显露出语义理解浅、策略同质化等局限。本课题“面向千人千面Agent的广告大模型能力构建”，旨在探索如何利用大语言模型结合广告个性化投放系统赋予智能体的核心能力，实现真正意义上的个性化智慧决策。

该课题会结合个性化建模、内容理解、大语言模型等能力，对用户心智做深度建模，依赖于历史行为长记忆的同时，能利用自然语言理解用户实时的微观意图、情感倾向与潜在需求。基于不同用户及不同上下文，能为不同用户量身定制差异化的广告投放，并且Agent能够以自然语言阐述其推理依据，让投放逻辑从“黑盒”走向透明，同时通过与用户反馈的持续交互，不断自我修正与进化。

这里面涉及到多方面的能力研究，包括基于内容的个性化能力的构建，个性化能力与大语言模型能力的结合，多模态融合能力，面向广告投放Agentic能力的微调能力以及面向广告投放系统的应用。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

TensorFlow+

PyTorch+

深度学习+

Linux+

C+++

Python+

还有更多 •••

登录查看完整学习资料

相关职位

【Ace顶尖实习生】面向多语言的AI搜索检索和生成系统研究

校招策略算法

本课题的研究目标是打造行业领先的多语言能力强化的大语言模型，结合业务海量的多语言互译语料，以及平台生活化特色的笔记评论数据，利用数据合成、RL冷启训练、SFT和RLHF等技术，实现： 1、在小红书多语言大模型翻译场景取得领先效果； 2、多语言场景下，AI搜索的检索和生成技术。

更新于 2026-07-27北京|上海|杭州

【Ace顶尖实习生】面向多业务场景的“理解-生成-决策”多模态统一大模型基座与智能体应用研究

校招内容理解

本课题旨在探索构建一套“理解-生成-决策”三位一体的多模态统一大模型基座及智能体应用。在底层基座构建上，重点构建理解与生成统一的图文交错混合模型：输入端实现多体裁内容（笔记、直播、商品等）的统一融合理解，输出端兼顾高质量表征提取、文本与图像生成。通过底层世界知识共享，消除多领域知识间的壁垒，并利用理解任务促进生成能力的提升。同时探索基于Multi-Head与MoE的轻量化微调及融合推理技术，在保证多场景下的效果前提下，压低训练和推理成本，实现降本增效。在上层应用落地上，面向内容发布场景打造多模态创作Agent能力，通过基座模型的Agentic能力提升（意图识别、规划与工具调用），将分散的图像处理与创作工具统一封装，用户仅需以多模态方式自然表达需求，Agent即可自动完成任务拆解与执行，大幅降低使用门槛，全面重塑内容创作体系。

更新于 2026-07-01北京|上海|杭州

【Ace顶尖实习生】Agentic RL技术研究

校招大模型

关注如何将RL引入工业级Agent平台系统，直接对“规划—执行—反馈”的完整轨迹进行优化。研究重点包括：如何构建trajectory-level reward、如何在工具调用与多步推理中进行credit assignment，以及如何在高成本环境下进行高效的offline/online混合训练。平台提供真实任务环境与多样化Agent执行数据，使研究从离线benchmark走向真实交互场景。该方向有望推动RL从模型对齐走向复杂任务能力学习，形成新一代Agent优化范式。

更新于 2026-04-06北京|上海|杭州

【Ace顶尖实习生】Agent Self-Evolution via Real-World Interaction

校招大模型

探索一种自进化Agent系统，使Agent能够在真实环境中通过持续交互不断优化自身能力。不同于静态模型训练，该方向强调“生成—执行—评估—更新”的闭环过程。关键问题包括：如何基于真实任务构建可靠的反馈信号，如何从稀疏成功案例中提取可泛化策略，以及如何避免自我强化中的分布偏移与错误积累。平台提供多场景Agent执行环境与完整轨迹数据，使得自进化机制可以在真实任务中验证。该方向旨在推动Agent从“被动能力载体”向“主动学习系统”转变，是实现长期智能演进的重要路径。

更新于 2026-04-06北京|上海|杭州