logo of xiaohongshu

小红书【Ace顶尖实习生】Agent Self-Evolution via Real-World Interaction

校招全职大模型地点:北京 | 上海 | 杭州状态:招聘

任职要求


1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、扎实的编程能力和算法功底,熟练掌握Python/C++/Java等至少一种编程语言;
3、扎实的机器学习/深度学习理论基础,有大规模推荐系统、计算广告、搜索引擎等核心算法项目经验;
3、有LLM/MLLM等多模态理解技术背景,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


探索一种自进化Agent系统,使Agent能够在真实环境中通过持续交互不断优化自身能力。不同于静态模型训练,该方向强调“生成—执行—评估—更新”的闭环过程。

关键问题包括:如何基于真实任务构建可靠的反馈信号,如何从稀疏成功案例中提取可泛化策略,以及如何避免自我强化中的分布偏移与错误积累。

平台提供多场景Agent执行环境与完整轨迹数据,使得自进化机制可以在真实任务中验证。该方向旨在推动Agent从“被动能力载体”向“主动学习系统”转变,是实现长期智能演进的重要路径。
包括英文材料
算法+
Python+
C+++
Java+
机器学习+
深度学习+
推荐系统+
还有更多 •••
相关职位

logo of xiaohongshu
校招策略算法

传统的AI搜索依然基于RAG框架,少有的几个Agent框架也只涉及QueryPlanning,距离真实解决搜索中的实际问题还相距很远,例如做旅游攻略、做行业研究报告等等。我们判断,虽然当下LLM已经大范围的用于搜索领域,但是下一代的搜索技术变革一定是基于Agent的。本课题旨在研究基于Agent框架的基座模型。

更新于 2026-03-24北京|杭州|上海
logo of xiaohongshu
校招数据引擎

本课题研究的目标是建设面向数据开发、数据分析和数据科学等场景的智能体Agent,对标Google Colab DataScience Agent,能够根据实际业务场景中的看数、分析、预测等需求,实现端到端的多任务的构建和编排,从而完成目前数仓、DI等日常工作。例如,对于数据开发场景,DataEngineer Agent 可以实现需求理解-> 找表 -> 指标设计 -> 数据建模 -> 任务代码生成->任务编排 -> 数据测试 -> 任务发布的全流程,从而进一步释放数据开发工程师的人力需求,支撑我们在保持精简的组织架构下,继续支撑业务的高速增长,实现卓越型组织架构。

更新于 2025-11-21杭州|上海|北京
logo of xiaohongshu
校招机器学习平台

本课题的研究目标是针对多Agent协同场景构建基于课程学习与分层强化学习的RL框架,从优先级经验回放(PER)、分布式经验复用和Actor-Critic异步计算优化等角度,攻克多目标冲突下的样本利用率低效问题。 该技术旨在突破传统RL训练在复杂任务(如小红书社区点点RL训练任务)中收敛慢、资源消耗高的瓶颈,实现训练效率提升3倍以上,支撑Agent服务快速迭代上线需求。

更新于 2025-11-21北京|上海|杭州
logo of xiaohongshu
校招大模型

关注如何将RL引入工业级Agent平台系统,直接对“规划—执行—反馈”的完整轨迹进行优化。 研究重点包括:如何构建trajectory-level reward、如何在工具调用与多步推理中进行credit assignment,以及如何在高成本环境下进行高效的offline/online混合训练。平台提供真实任务环境与多样化Agent执行数据,使研究从离线benchmark走向真实交互场景。该方向有望推动RL从模型对齐走向复杂任务能力学习,形成新一代Agent优化范式。

更新于 2026-03-27北京|上海|杭州