logo of jd

京东基于强化学习在用增营销场景的交互式推荐与技术应用

校招全职搜索推荐广告方向地点:北京状态:招聘

任职要求


1、获得本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;
2、精通大模型优化手段,包括预训练、后训练、RAG、多智…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、权益投放系统:结合大模型生成、强化学习、离线机器学习模型技术优化全链路投放算法;
2、补贴优化:运用权益弹性模型&大规模优化等技术,为plus、拉新补贴优化、站内权益投放优化用户补贴。
包括英文材料
学历+
大模型+
RAG+
还有更多 •••
相关职位

logo of hello
社招3年以上技术

1. 负责哈啰两轮出行领域,用户增长相关的算法策略设计与优化,包括但不限于:用户画像体系建设、新用户转化率提升、用户激活与留存模型、裂变增长策略等。 2. 基于用户行为数据,构建精准的LTV(用户生命周期价值)预测模型、流失预警模型及分层运营策略。 3. 设计并实现高效的推荐算法、补贴发放策略或激励体系,平衡用户体验与平台增长目标。 4. 深入分析A/B实验数据,迭代算法模型,驱动用户规模与质量的持续增长。 5. 探索前沿增长技术(如因果推断、强化学习等),推动算法在业务场景中的创新落地。

更新于 2025-07-22上海
logo of alibaba
社招1年以上技术类-算法

团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.基于Lazada的海量用户和商家数据,探索使用深度学习,强化学习,Graph Embedding,迁移学习,知识图谱等前沿技术来解决广告业务所面临的多国家多语言场景,大规模异构数据的挑战,将前沿技术在广告业务上落地,用技术推到业务高速发展。 2.负责广告系统的核心召回、排序、竞价机制算法持续迭代优化,提升广告业务的核心指标,帮助Lazada广告业务高速增长。

更新于 2025-10-22杭州|北京
logo of meituan
校招核心本地商业-业

研究方向一:下一代端到端生成式 广告大模型系统广告系统一般采用“召回->粗排->精排->出价->拍卖”的多级漏斗架构,但各模块独立优化导致优化目标不一致,前链路会制约后链路上限,漏斗效率折损大。近年来,随着大模型和生成式技术的快速发展,其强大的表征能力和良好的Scaling性质也为广告系统提供了新的可能性。本研究旨在探索如何利用生成式技术重塑整个广告系统,通过一个端到端的生成式广告大模型完成所有决策,打破多级漏斗框架,打开模型决策空间,最大化平台收益。 1.生成式广告大模型架构设计:基于前沿大模型(如时空Transformer、MLA、MoE等),设计适配广告场景的生成式决策框架,支持根据“用户行为、实时位置、商户出价”端到端生成最优的广告商家、展示创意、相应计费。 2.多阶段的训练范式设计:借鉴LLM的分阶段训练技术(如PT、SFT、RLHF等),设计“基于海量交互的 pre-training 和 基于业务目标的 post-training ”的分阶段训练范式,提升广告大模型效果。 3.广告大模型的Scaling规律探索:探索广告场景下,生成式大模型“算力->效果”的转化规律,驱动推广搜迭代范式实现由“人工设计迭代”到“算力堆叠迭代”的跃迁。 研究方向二:基于大模型重构广告系统 传统的向量召回和深度学习推荐范式在深度交互、冷启动、长尾商品发现、多场景适配等方面仍存在诸多挑战。 大模型具备强大的内容理解、知识推理和个性化内容生成能力。以大模型为核心,通过将用户历史行为、上下文信息、多模态内容等深度融合,实现用户意图的主动理解、候选内容的生成与多场景下的精准推荐,极大提升广告系统召回、粗排、精排、拍卖等模块的能力上界。 1.领域LLM 构建:基于sota 基座模型,系统性整合美团用商双端数据,通过PT、SFT、RLHF等方式构建适配外卖/到餐领域的垂直领域LLM,快速支持商业广告系统多大模型应用落地; 2.基于强化学习+领域LLM 的通用广告解决方案:基于领域LLM,结合GRPO等强化学习技术,探索广告召回、粗排、精排建模的新范式,探索广告领域建模的scaling law; 3.结合广告业务场景与大模型前沿技术,探索改造广告算法链路的创新方向,实现广告算法链路的大规模升级及核心指标的显著提升。

更新于 2025-05-23北京|上海
logo of tongyi
实习通义研究型实习生

1、研究与算法实现: (1)参与图数据库代码知识图谱的构建与优化,借鉴最新的 RepoAudit 等研究成果。 (2)设计并实现基于强化学习(RL)的探索与反馈循环,包括智能体、动作空间、奖励机制。 (3)实验和优化多种RL策略(如PPO、DPO、GRPO、DAPO、GSPO)在真实图数据库测试场景的应用。 2、系统开发与实验: (1)构建可编译运行的图数据库测试平台,负责自动化测试流程(提出预言机→生成用例→执行验证→反馈奖励)的实现。 (2)针对开源图数据库(NeuG、Neo4j、RedisGraph、NebulaGraph等),验证并提交新型逻辑错误。 3、论文与成果输出: (1)参与撰写技术报告和学术论文,总结测试预言机生成的新方法与实验结果。 (2)协助开源端到端研究原型及技术文档的完善与维护。

更新于 2025-09-24北京|杭州