小红书【Ace顶尖实习生】Agentic RL技术研究
任职要求
1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先; 2、扎实的编程能力和算法功底,熟练掌握Python/C++/Java等至少一种编程语言; 3、扎实的机器学习/深度学习理论基础,有大规模推荐系统、计算广告、搜索引擎等核心算法项目经验; 3、有LLM/MLLM等多模态理解技术背景,…
工作职责
关注如何将RL引入工业级Agent平台系统,直接对“规划—执行—反馈”的完整轨迹进行优化。 研究重点包括:如何构建trajectory-level reward、如何在工具调用与多步推理中进行credit assignment,以及如何在高成本环境下进行高效的offline/online混合训练。平台提供真实任务环境与多样化Agent执行数据,使研究从离线benchmark走向真实交互场景。该方向有望推动RL从模型对齐走向复杂任务能力学习,形成新一代Agent优化范式。
我们致力于构建可持续进化的 Agent 系统:让 Agent 在真实环境中通过交互、学习与数据闭环,不断提升复杂任务能力。 围绕“数据 → 学习 → 自进化”三位一体展开: - Agent 自进化: 基于真实任务轨迹与反思机制,提升 Agent 在长期交互中的自主学习能力,解决反馈建模、策略泛化与错误累积问题。 - RL for Agent Systems: 将强化学习引入 Agent 全链路(规划-执行-反馈),研究 trajectory-level reward、credit assignment 及 offline/online 混合训练。 - Agentic Data Construction: 构建由 Agent 主导的数据生产与筛选机制,形成“生成 → 评估 → 反哺”的数据闭环,持续放大模型能力。
1、 根据集团战略发展方向,拓展浙江省地市政府、央国企领域及体制内目标客户和合作伙伴的云业务; 2、 负责地市政务关系管理,制定并推动区域、行业、重点客户市场拓展计划并执行; 3、针对数字政务、医疗、城市大脑、城市智算、行业大模型等领域,拉通政府及合作伙伴资源,挖掘和引导需求,创造商业机会; 4、与客户或合作伙伴进行重点项目对接,积极有效的推动合同拟定、谈判等商务流程; 5、协调公司内部产品、研发、运维、财务、法务等资源,积极有效的推动合同拟定、谈判等商务流程,高效达成销售业绩; 6、与政企客户和合作伙伴建立长期积极互动关系,促进阿里云政企业务的良性发展。
1、负责阿里云大客户的商务运作及拓展; 2、对互联网行业和云计算有较为深刻的洞察,对互联网AI行业生态链熟悉者优先; 3、有丰富的大客户维护经验和全局化视角,能够独立完成重点项目挖掘、布局、运作和管理; 4、有较强的内外部资源整合能力,完成项目的推动与落地,提升客户整体满意度;