
智能互联淘宝闪购-用户增长-Agent工程专家-北京
任职要求
1. 专业能力 RL / 决策智能:理解 MDP、策略梯度、Q-Learning、Actor-Critic 等核心概念,了解 Offline RL 或 Model-based RL;能将业务问题建模为 RL 问题 工程能力:精通 Python,熟练掌握 Java 或 C/C++ 至少一种;熟悉 PyTorch,了解分布式训练原理 生成式 AI:理解 LLM 的能力与局限,熟悉 Prompt Engineering、RAG、Agent 框架等应用范式;对多模态内容生成有基本认知 AI Coding:AI 编程工具重度玩家,具备极强的 Prompt 编写与调优能力,理解如何让 AI 写出生产级代码 2. 能力特质 能快速啃透前沿论文并转化为工程代码 有独立完成的开源…
工作职责
聚焦用户增长(User Growth)核心业务场景,利用强化学习(RL)与生成式 AI 技术推动业务智能化升级。你将在真实的亿级流量场景中,参与从算法策略到工程落地的全链路建设,解决广告竞价、创意生成、用户生命周期管理等高价值问题。 岗位职责: 1. RL 出价与竞价策略 参与基于强化学习的广告出价系统建设,将静态出价升级为多步序列决策范式,构建 State → 推理 → Action → Reward 的完整闭环 探索 Decision Transformer / Offline RL 等前沿方法在 RTB 竞价场景的落地 2. RL 训练与推理工程 参与 RL / LLM RL 训练框架建设,支撑 PPO、DQN、GRPO 等算法的高效落地,优化训推异步与分布式训练策略 解决 RL 训练中的工程瓶颈(样本传输延迟、显存优化、训练稳定性),跟进 VERL、Ray 等前沿框架并结合业务落地 3. AIGC 创意与 Agent 工程 设计和实现 AIGC 驱动的规模化创意供给体系,覆盖文案生成、图片创意、视频素材等多模态内容生产,构建生成 → 风控审核 → 语义去重 → 效果反馈的全链路闭环 构建面向用增业务的 AI Agent 系统(创意 Agent、广告优化师 Agent 等),设计多智能体协同架构与工具集成方案 4. AI Coding 与研发效能 深度使用 AI 编程工具(Cursor、Claude Code 等)驱动日常研发,探索 AI 辅助代码生成、代码审查、自动化测试等场景的最佳实践 参与 AI Coding 全链路覆盖的推进,提升团队 AI 辅助代码占比与研发效能 5. 在线引擎与实验体系 参与用增引擎体系(RTA / RTB / 创意供给引擎)核心模块开发,优化高并发系统性能与稳定性 建设特征工程、样本回流与 AB 实验体系,支撑策略的科学评估
聚焦用户增长(User Growth)核心业务场景,利用强化学习(RL)与生成式 AI 技术推动业务智能化升级。你将在真实的亿级流量场景中,参与从算法策略到工程落地的全链路建设,解决广告竞价、创意生成、用户生命周期管理等高价值问题。 岗位职责: 1. RL 出价与竞价策略 参与基于强化学习的广告出价系统建设,将静态出价升级为多步序列决策范式,构建 State → 推理 → Action → Reward 的完整闭环 探索 Decision Transformer / Offline RL 等前沿方法在 RTB 竞价场景的落地 2. RL 训练与推理工程 参与 RL / LLM RL 训练框架建设,支撑 PPO、DQN、GRPO 等算法的高效落地,优化训推异步与分布式训练策略 解决 RL 训练中的工程瓶颈(样本传输延迟、显存优化、训练稳定性),跟进 VERL、Ray 等前沿框架并结合业务落地 3. AIGC 创意与 Agent 工程 设计和实现 AIGC 驱动的规模化创意供给体系,覆盖文案生成、图片创意、视频素材等多模态内容生产,构建生成 → 风控审核 → 语义去重 → 效果反馈的全链路闭环 构建面向用增业务的 AI Agent 系统(创意 Agent、广告优化师 Agent 等),设计多智能体协同架构与工具集成方案 4. AI Coding 与研发效能 深度使用 AI 编程工具(Cursor、Claude Code 等)驱动日常研发,探索 AI 辅助代码生成、代码审查、自动化测试等场景的最佳实践 参与 AI Coding 全链路覆盖的推进,提升团队 AI 辅助代码占比与研发效能 5. 在线引擎与实验体系 参与用增引擎体系(RTA / RTB / 创意供给引擎)核心模块开发,优化高并发系统性能与稳定性 建设特征工程、样本回流与 AB 实验体系,支撑策略的科学评估

1. 基于淘宝闪购-客如云餐饮&零售SaaS业务,进行餐饮SaaS数据产品体系和能力的搭建,包括数据中台、商家经营数据指标体系、BI自定义数据产品、场景智能分析数据产品、数据开放平台等产品建设; 2. 深入了解与理解本地业务,理解数据产品业务本质和SaaS商业客户经营的关系,抽象通用能力,打造创新高效、标准化、可复用的数据产品解决方案; 3. 负责产品全生命周期建设,与数据工程、算法、研发、业务团队紧密协作,确保数据产品高效支撑业务增长、风险控制、用户体验优化等关键场景; 4. 跟踪行业趋势(如LLM+Data、AI原生数据产品等),探索大模型、生成式AI在数据产品中的应用场景,推动数据产品智能化升级,如自然语言查询、自动洞察、智能预警、个性化数据推荐等,保持公司在数据产品领域的竞争力。
1、基于淘宝闪购本地生活业务,聚焦营销/推荐/搜索算法策略的优化、用户体验/产品效率提升、Al Agent赋能等方向,通过科学的指标体系定义和严谨的数据分析,快速发现、定位业务与技术方向的问题与机会 2、负责复杂实验的设计和评估,通过A/B或因果推断方法进行度量和分析,驱动算法&产品&策略持续优化创新,实现目标的增长和效率提升 3、利用数据挖掘、统计建模等方法主动完成较为深入的专项数据分析与洞察,将复杂问题进行拆解、定义并设计合理的解决方案,与各协作团队紧密配合,推进方案落地取得收益