logo of meituan

美团【大模型北斗实习】长周期人机协作能力探索和评测

实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


1)熟悉大模型相关的推理、训练框架,有较强的工程实践能力和经验。
2)有一定的学术研究背景,对前沿技术保持好奇心,学习能力和自驱力强。
加分项:
1)在有影响力的开源项目中做出核心贡献。
2)发表过高质量学术论文。

工作职责


大模型的语言理解与生成能力标志着基于人类语言的人机交互接口接近成熟。通过agent框架拓展系统环境适应力,结合推理技术突破(如o1/R1)强化中枢决策能力,内外协同将加速实现长周期人机协作,提升生产力。本课题希望逐步实现长周期人机协作所需的大模型agent能力,并解决其中涉及的模型训练和评估问题。研究内容包括但不限于:
1)长周期人机协作所涉及的模型能力拆解。
2)针对长周期协作所涉及的具体能力构建agent框架。
3)基于能力拆解建设相关的评测评估方案。
4)通过模型微调等手段优化相应的模型能力。
包括英文材料
大模型+
相关职位

logo of meituan
实习核心本地商业-业

【课题说明】 在广告场景中,优质精美的创意对用户的行为决策有显著正向影响,传统模式下商用级创意内容的制作门槛高、生产周期长,长尾商家通常难以负担其成本,而头腰部商家也难以做到个性化、高时效性的创意生产投放。 本课题借助大模型的音、视、图、文等多模态理解、思考与生成能力,结合用户画像、商户/品特征、热点趋势等信息,探索实现低成本、个性化的商用级创意内容(如图文笔记、长视频)的生成技术。 【建议研究方向】 1.多模态深度思考:设计与实现多模态深度思考方案,优化模型对多源异构信息进行抽取筛选、加工整合、衍生创作的能力,提升创意内容生成的质量与多样性。 2.开放问题的强化学习:针对无标准答案的开放问题(如笔记生成、剧本创作、素材选取等),设计与实现适配的奖励机制与策略,通过强化学习提升模型能力。 3.创意生产Agent:参考人工生产中的不同角色分工合作流程,设计与实现创意生产的多agent协作框架,并通过线上效果反馈机制,闭环提升生产的效率与质量。

更新于 2025-05-27
logo of meituan
实习核心本地商业-基

探索下一代大模型预训练范式,从模型结构、训练策略、数据策略、算力利用率等角度切入,打造具有更强能力和更高潜力的基座模型。 1)设计更高效的模型结构,提高给定数据量、计算量、硬件型号、输出序列长度等约束下的模型能力,如长序列能力、记忆能力等。 2)探索更科学的训练策略,对影响training dynamic的关键变量(如学习率、batchsize、初始化等)形成更科学的认知,探索更适合大模型的optimizer等。 3)研究模型结构和数据的耦合关系,优化分阶段训练范式。 4)结合MLsys解决大规模训练中遇到的卡点问题,实现算法和工程联合设计。

更新于 2025-05-23
logo of meituan
实习核心本地商业-基

本课题探索大模型垂直领域知识高效增强方法,包括数据策略、训练策略以及scaling law友好的训练方法,打造适配实际应用所需的基座能力。研究内容包括但不限于: 1) 大模型基座知识能力增强,通过大规模continue pretrain打造生活服务领域基座,赋能美团各类大模型应用场景。 2)探索预训练增强阶段的大规模高质量数据自动合成、Scaling Law、长链条复杂推理反思能力增强。 3)建设生活服务chat模型与智能体,通过强化学习等方式增强模型推理反思、复杂指令遵循、高情商交互等能力,支撑大模型在生活服务领域的应用。

更新于 2025-05-23
logo of meituan
实习核心本地商业-基

多模态理解与生成能力是大模型实现通用人工智能的核心基石之一,涵盖了跨视觉、语言等多种模态的信息处理与创造。本课题致力于探索统一的多模态大模型架构,打通理解与生成之间的壁垒,研究如何在单一模型框架下实现对多模态信息的深度理解与高质量生成,从而构建具备更强泛化能力和创造性的通用人工智能大模型。 研究内容: 1)视觉表征研究:不同规模和训练范式的视觉基座预训练,模型结构探索和选型,开发更适合于多模态大模型的视觉基座。 2)理解生成统一:面向不同的多模态架构和训练范式,从视觉基座的角度深入探索视觉连续表征和离散表征的联系和区别,探索更具通用性的多模态特征。 3)视频多模态能力提升:探索短视频、长视频、视频流等不同形态的视频多模态方案,探究图像、视频统一的多模态解决方案。 4)高效和轻量化模型构建:探索适合轻量化多模态任务的模型架构,通过参数共享、模块化设计等手段,在不显著降低性能的前提下减少模型参数量和计算复杂度。

更新于 2025-05-23