美团【基座大模型北斗实习】面向真实世界长程开放任务的智能体研究
实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘
任职要求
1、硕士及以上学历,计算机、人工智能、数学、自然语言处理等相关专业,博士优先; 2、在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
简介:真实世界中智能体应对长周期、多步骤、开放式的任务目标仍存在瓶颈,如多日旅行规划、专业领域深度研究等任务均呈现长交互轮次、多依赖子任务、全局约束严格的特征,当前智能体易出现上下文丢失、计划漂移、误差累积等问题,难以支撑超长轮次、超长时间的超长程任务执行。本课题研究方向包括但是不限于: 1、长程任务鲁棒规划:结合思维链(CoT)、思维树(ToT)等方法,实现复杂目标的可执行子任务拆解,兼顾子任务依赖关系与全局时间/成本约束;研究基于实时环境反馈的重规划机制,解决“模拟漂移”导致的计划与现实脱节问题,提升规划鲁棒性;设计高效的上下文管理与记忆压缩技术,避免长交互过程中关键信息遗忘,支撑超长序列任务的稳定执行。 2、开放环境动态适应:探索解决真实世界中目标模糊、环境多变、突发干扰下的任务持续执行难题。 3、高效学习范式:研究真实世界开放任务reward以及过程奖励设计方法,为长程任务中间步骤提供有效反馈,解决奖励稀疏问题;研究开放环境下的持续学习方法,避免“灾难性遗忘”,增强智能体在新场景、新任务中的泛化能力。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••