美团【北斗】Agent算法研究员(强化学习、自进化方向)
校招全职核心本地商业-业务研发平台地点:北京状态:招聘
任职要求
【任职资格】 必要条件: 1.2027届本科及以上学历,计算机、人工智能等相关专业; 2.在大模型后训练等方面有深入实践,具备较强的动手能力; 3.扎实的深度学习和计算机理论基础,精通主流深度学习框架(如Tensorflow、Pytorch); 4.具备强悍的工程思维和代码能力,熟练使用Python/C++等编程语言。 加分项: 1.在ICLR/ICML/NIPS/ACL/CVPR等国际顶会有论文发表经历优先; 2.优秀的分析、解决问题能力,对AGI的未来趋势与…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
【愿景】 打造全球领先的本地生活智能平台,让每一次搜索和推荐都精准理解用户需求,从被动匹配走向主动认知推理。我们致力于成为大模型在搜索与推荐场景落地的标杆团队,推动行业从传统深度模型向生成式智能的范式跃迁,用AI能力重新定义下一代生活服务入口。 【你将参与】 方向一:个性化自进化与主动探索算法机制 1.探索与利用权衡: 负责设计前沿的主动探索训练目标与触发机制,引入不确定性感知等机制,使 Agent 能够根据当前交互状态、上下文历史自主判断自适应进化方向。 2.高价值信息捕获: 在极低用户打扰的约束下,设计高效的主动追问与澄清策略,精准、主动地获取用户深层高价值偏好信息。 方向二:多轮交互奖励建模与 RL 策略优化 1.长期价值奖励建模: 负责构建面向长期交互与用户留存的奖励模型体系,将用户显式反馈(追问、点击)与隐式行为(停留、改写)转化为高置信度的显式/隐式奖励信号。 2.强化学习策略对齐: 运用先进的强化学习算法(如 PPO、GRPO、在线/交互式 RL),优化模型在多轮对话与 AI 搜索场景下的样本效率与收敛性。基于严谨的理论框架(如收敛性保证、遗憾界分析),指导算法的原则性设计,确保策略在复杂、长尾多场景迁移时的可解释性与可靠性。 方向三:Agent 闭环体系建设与全链路落地 1.可插拔个性化内化模块: 研发高容量、强泛化性的个性化信息内化与记忆模块,动态攻克信息更新频率与偏好识别精度之间的权衡难题。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••