美团大模型算法实习生（深度推理强化、基座增强、智能体应用方向）

实习兼职核心本地商业-基础研发平台2026-03-23地点：北京状态：招聘

扫码手机上打开

任职要求

1. 熟悉大模型的原理，具备数据处理、精调、预训练、强化等方面的经验；
2. 熟悉自然语言处理常见算法与模型，具备深度学习技术在NLP领域的应用实践； 
3. 具备良好的编程实现能力，熟悉C++、Python、Java等常用编程语言中至少一种； 
4. 具备强烈的进取心、求知欲及团…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 基座增强：探索大模型垂直领域知识高效增强方法，包括数据策略、训练策略以及scaling law友好的训练方法，打造适配实际应用所需的基座能力；
2. 多模态端到端：实现语音与文本模态的深度融合与统一建模，打造高效、轻量的端到端多模态系统，从而有助于更全面、多维度地理解语音与文本，提供更强的智能以及更智能的交互模式；
3. 深度推理：突破大模型在复杂逻辑推理、因果推断、多步决策、沟通技巧等大模型基础通用能力，提升模型解决开放式问题的能力；
4. 结合大模型，研发对话交互场景的大模型Agent，支持智能客服、销售、数据分析、C端助理等项目，通过预训练、微调、强化学习等全链路的技术实践，实现类人的理解和执行能力，提升美团服务能力和效率；
5. 不断探索技术新领域，推动技术能力的沉淀和技术氛围的建设。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

NLP+

算法+

深度学习+

C+++

Python+

还有更多 •••

登录查看完整学习资料

相关职位

大模型算法实习生

实习研发

1、参与 Deep Learning Planning 算法设计、模型训练、评测构建等相关工作； 2、运用深度强化/机器学习等技术，优化模型结构，提高模型对复杂驾驶场景的理解和应对能力； 3、针对业务需求和实车Bad Case，设计并验证优化方案，完成算法的持续迭代； 4、负责收集、标注和处理自动驾驶相关数据，构建高质量的数据集，为模型训练提供有力支持；

更新于 2025-08-27北京

大模型算法实习生

实习核心本地商业-基

1. 后训练研究：深入参与模型对齐工作，重点研究多种后训练算法；探索结果奖励和过程奖励模型的构建，提升模型在复杂逻辑下的推理能力。 2. Agentic RL优化：针对复杂业务场景，优化 Agent 的任务规划、反思与执行能力；提升模型在长链路任务中的稳定性和成功率。 3. 前沿技术落地：跟踪业界前沿技术路线，负责相关算法的复现、调优及在业务场景中的工程化落地。

更新于 2026-07-24北京

大模型算法实习生

社招1-3年

1、负责利用自然语言处理和机器学习算法，实现客服、销售、收派、运营、办公职能等业务板块大模型的应用落地，支持业务目标的提升； 2、负责大模型的继续预训练、SFT、 RLHF与推理等工作，能够根据场景需求设计高效的训练方案，并解决训练中出现的问题，如过拟合、知识遗忘、上下文漂移等； 3、紧跟大模型技术的最新进展，面向集团各类业务场景，沉淀共性能力，实现大模型技术的标准化与产品化。

更新于 2026-07-02深圳

大模型算法实习生

实习核心本地商业-基

1. 研发对话交互场景的大模型Agent，通过数据合成、偏好训练、多轮RL等方法提升大模型的指令遵循、推理规划、沟通情商、工具调用等能力。 2. 探索前沿技术的创新与领域适配，推动前沿技术在实际业务中的落地应用，同时将有价值的技术问题和方案总结发表。 3. 支持AIBD等项目，通过预训练、微调、强化学习等全链路的技术实践，实现类人的理解和执行能力，提升美团服务能力和效率。

更新于 2026-07-24北京|上海