美团【北斗实习】大模型算法研究员
实习兼职核心本地商业-美团平台地点:北京 | 上海状态:招聘
任职要求
1. 博士在读优先,计算机、人工智能、自动化、数学、物理等相关专业。 2.在强化学习、语言模型、机器学习等一个或多个领域有较深入的研究者。 3. 好奇心驱动,具有出色的分析、解决…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
【课题说明】 探索本地生活服务场景下的AI原生应用优化,包括Agentic RL相关前沿领域与业务的结合,拥有独特的垂直领域高质量数据(本地生活场景),获得在业内最前沿的大模型认知和技术积累,既能做前沿 Research,也有直接的落地场景。 【研究方向】 1. 探索模型通过 RL Scaling 等方式使用成套工具解决复杂问题的行动和规划能力,包括 Human in the Loop 多轮交互下 Agent 基础建模的新方案、以及与复杂环境的交互学习能力。 2. 探索模型在 Non-Rule Based Outcome 场景下利用复杂信息进行有效 Reasoning 推理的范式,包括 Proactive Agent 的建模方案 。 3. 探索研究更多内在奖励的机制,从而激发模型主动学习和自我更新的能力。 4. 探索构建长期记忆机制,为下一代高效的推理模型、长序列推理及建模提供基础。
包括英文材料
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.