饿了么淘宝闪购-用户增长-Agent工程专家-北京
社招全职2年以上技术类-开发地点:北京状态:招聘
任职要求
1. 专业能力 RL / 决策智能:理解 MDP、策略梯度、Q-Learning、Actor-Critic 等核心概念,了解 Offline RL 或 Model-based RL;能将业务问题建模为 RL 问题 工程能力:精通 Python,熟练掌握 Java 或 C/C++ 至少一种;熟悉 PyTorch,了解分布式训练原理 生成式 AI:理解 LLM 的能力与局限,熟悉 Prompt Engineering、RAG、Agent 框架等应用范式;对多模态内容生成有基本认知 AI Coding:AI 编程工具重度玩家,具备极强的 Prompt 编写与调优能力,理解如何让 AI 写出生产级代码 2. 能力特质 能快速啃透前沿论文并转化为工程代码 有独立完成的开源…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
聚焦用户增长(User Growth)核心业务场景,利用强化学习(RL)与生成式 AI 技术推动业务智能化升级。你将在真实的亿级流量场景中,参与从算法策略到工程落地的全链路建设,解决广告竞价、创意生成、用户生命周期管理等高价值问题。 岗位职责: 1. RL 出价与竞价策略 参与基于强化学习的广告出价系统建设,将静态出价升级为多步序列决策范式,构建 State → 推理 → Action → Reward 的完整闭环 探索 Decision Transformer / Offline RL 等前沿方法在 RTB 竞价场景的落地 2. RL 训练与推理工程 参与 RL / LLM RL 训练框架建设,支撑 PPO、DQN、GRPO 等算法的高效落地,优化训推异步与分布式训练策略 解决 RL 训练中的工程瓶颈(样本传输延迟、显存优化、训练稳定性),跟进 VERL、Ray 等前沿框架并结合业务落地 3. AIGC 创意与 Agent 工程 设计和实现 AIGC 驱动的规模化创意供给体系,覆盖文案生成、图片创意、视频素材等多模态内容生产,构建生成 → 风控审核 → 语义去重 → 效果反馈的全链路闭环 构建面向用增业务的 AI Agent 系统(创意 Agent、广告优化师 Agent 等),设计多智能体协同架构与工具集成方案 4. AI Coding 与研发效能 深度使用 AI 编程工具(Cursor、Claude Code 等)驱动日常研发,探索 AI 辅助代码生成、代码审查、自动化测试等场景的最佳实践 参与 AI Coding 全链路覆盖的推进,提升团队 AI 辅助代码占比与研发效能 5. 在线引擎与实验体系 参与用增引擎体系(RTA / RTB / 创意供给引擎)核心模块开发,优化高并发系统性能与稳定性 建设特征工程、样本回流与 AB 实验体系,支撑策略的科学评估
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Prompt+
https://cloud.google.com/vertex-ai/generative-ai/docs/learn/prompts/introduction-prompt-design
A prompt is a natural language request submitted to a language model to receive a response back.
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/prompt-engineering
These techniques aren't recommended for reasoning models like gpt-5 and o-series models.
https://www.youtube.com/watch?v=LWiMwhDZ9as
Learn and master the fundamentals of Prompt Engineering and LLMs with this 5-HOUR Prompt Engineering Crash Course!
RAG+
https://www.youtube.com/watch?v=sVcwVQRHIc8
Learn how to implement RAG (Retrieval Augmented Generation) from scratch, straight from a LangChain software engineer.
还有更多 •••
相关职位
社招3年以上技术类-数据
1、基于淘宝闪购本地生活业务,聚焦营销/推荐/搜索算法策略的优化、用户体验/产品效率提升、Al Agent赋能等方向,通过科学的指标体系定义和严谨的数据分析,快速发现、定位业务与技术方向的问题与机会 2、负责复杂实验的设计和评估,通过A/B或因果推断方法进行度量和分析,驱动算法&产品&策略持续优化创新,实现目标的增长和效率提升 3、利用数据挖掘、统计建模等方法主动完成较为深入的专项数据分析与洞察,将复杂问题进行拆解、定义并设计合理的解决方案,与各协作团队紧密配合,推进方案落地取得收益
更新于 2025-10-22北京|上海
社招4年以上技术类-前端
1. 负责商家系统的前端架构设计、开发与持续优化,在APP、PC等渠道交付高质量的产品; 2. 围绕React技术体系和跨端容器,构建高可用、高性能、可扩展的跨端解决方案,确保产品的稳定性与用户体验; 3. 面向商家业务特点,推动建立统一的前端技术规范,开发流程与测试部署的最佳实践,推动团队效能提升; 4. 持续探索前沿技术(如大模型、Agent、MCP等),通过技术创新驱动业务增长与效率提升; 5. 关注并实践前端前沿技术,通过新技术反哺团队和前端技术产品及技术工具。
更新于 2026-01-21上海
社招3年以上产品类-用户型
1. 负责淘宝闪购的用增外投的流量转化产品工作,为转化效率负责,为C端用户资产的增长负责。 2. 承接用增外投的流量,建设从外到内的完整产品链路;根据不同的流量点位类型,设计适合的投放与承接方案,提升唤端率、下载率、场景还原率等关键指标。 3. 建设用户转化的页面产品,根据不同的用户标签,结合闪购内的多种权益、供给等,设计用户激励玩法,丰富转化手段,提升转化率。建设相关的后台产品能力,支持业务快速实验和策略沉淀。 4. 与商业化团队合作,找到外投流量的商业化机会,提升商业化收入。
更新于 2026-01-30杭州