美团【北斗实习】大模型应用算法工程师-【AI搜索】
任职要求
海内外高校在校本科生(大三及以上)、硕士生及博士生,且以下条件至少满足一项: 1)超级学霸:专业成绩排名前1%。 2)学术达人:在顶级期刊或学术会议上以第一作者身份发表论文(或导师一作,自己为二作)。 3)竞赛大神:在顶级大赛上获奖。 4)工程高手:有大厂实验室的实习经验,或有贡献突出的开源项目。
工作职责
【课题说明】 Agentic Search是以大模型为核心,具备自主感知、推理与行动能力的搜索新范式。它通过理解用户复杂意图,动态规划搜索路径,主动调用多种工具和数据源,持续优化结果推荐与交互体验。本课题旨在研究和构建面向美团App本地生活服务的Agentic Search系统,探索其在多轮对话、复杂任务分解、实时信息整合等场景下的关键技术与应用价值,推动本地生活智能搜索技术的创新升级。 【建议研究方向】 1.意图理解与任务分解:探索大模型在复杂用户需求下的多意图识别、任务分解、子任务规划能力,提升系统对复合型检索场景的适应性和响应能力。 2.多轮工具调用技术研究:赋予LLM长链路的多轮工具调用能力,打造基于强化学习等前沿技术的LLM后训练方案,提升多轮调用时的精确性及用户的实际交互体验。 3.增量学习训练技术探索:针对本地生活场景中数据不断更新的特点,运用增量学习技术,使 AI 搜索模型能够快速适应新数据。 搜索结果可解释性提升:探索基于大模型内容深度理解与推理的可解释理由生成,增强用户对搜索结果的信任感和透明度。
【课题说明】 面向C端用户的医药健康AI助手项目旨在重塑用户未来的看病范式,给用户提供AI问诊、对症找药、药品问答、医疗科普等多元化核心能力,在用户诊前、诊中、诊后的关键环节提供专业的医疗决策支持,从而促进线上看病一体化链路的打通,率先形成线上便捷+专业的看病入口。 【建议研究方向】 1.医药Agent技术架构设计:针对问病、问药、科普等场景分别建设专业的子Agent能力,并优化多Agent之间的协作逻辑,满足用户灵活的多轮对话交互需求。 2.模型自动化评测:从医学专业性和用户体验维度构建多维度benchmark,并探索Agent各能力项的Auto-Eval做法,提升模型评测效率和结果可靠性。 3.模型后训练技术:探索合成数据技术方案来快速积累高质量医疗训练数据,并通过SFT、强化学习等手段持续提升模型在医学问答、病情采集、疾病诊断、药品推荐等关键任务上的表现和泛化能力。
【课题说明】 通用模型往往难以兼顾多样化的场景需求,容易出现泛化能力强但针对性不足的问题。针对这一挑战,本课题聚焦于研究面向具体业务或应用场景的强化学习训练优化策略,通过引入场景特定的奖励函数、环境建模和数据采样机制,提升模型在特定任务下的表现能力与适应性。课题重点突破模型在细粒度场景下的泛化能力不足、奖励稀疏、训练效率低等问题,为大模型的行业落地提供有力支撑。 【建议研究方向】 1.场景特定奖励设计:针对不同业务场景,定制化设计奖励函数,提升模型在目标任务中的表现能力。 2.环境模拟与数据生成:构建高保真场景模拟环境,开发高效的数据采样与生成机制,提升强化学习训练效率。 3.迁移与泛化能力增强:研究多场景迁移学习与元强化学习方法,提升模型从通用能力到场景定制能力的转化效率。 4.推理增强型RAG系统:基于图结构的知识融合、混合模型的协同推理架构和强化学习驱动的优化方法,进一步提升RAG系统能力。 5.基于价值观约束的大模型风险控制与安全防护。
【课题说明】 以大模型对话技术为核心,探索前沿技术问题。研究方向包括角色扮演、个性化对话、记忆管理,拟人化,数字人等,主要业务场景包括运营,招聘,销售,审核等。目标是构建覆盖多个场景的Agent系统,实现“技术驱动业务范式”的升级转变。 【建议研究方向】 1. 大模型个性化(Personalized LLM):通过角色扮演、用户行为数据挖掘与建模、上下文理解等方法,分析用户情感状态,提升模型的个性化回复能力。 2. 面向语音交互的拟人化技术(Voice Agent):优化大模型在语音对话场景的效果,提升大模型的拟人化水平,探索下一代端到端语音对话大模型的技术实现。 3. 记忆管理与增强(Memory):通过优化模型长上下文能力、设计记忆抽取与管理模块,提升系统的记忆能力。 4. 基于LLM的RL(LLM-based RL):通过强化学习,提升模型规划、决策、推理等能力。 我们将提供充足的计算资源和良好的工作自由度,目标是产出有影响力的工作,解决业务实践中的问题。
【课题说明】 大模型研发正从“人类数据时代”跨入“经验时代”,评估已然是大模型研发的重点和难点。具体而言,评估驱动的行业大模型研发下半场范式主要包括两方面内容:①行业核心问题定义和评估归因;②Post-Training多阶段协同的效果提升。本课题基于美团的本地生活业务,精选销售、履约、医药和客服四个代表性行业,旨在探索评估驱动的行业大模型研发的下半场范式。 【建议研究方向】 1.行业大模型通用评估方案探索。 2.行业模型reward设计与探索。 3.面向行业推理能力建设的通用自动化样本构建方法和评估归因方法。 4.面向行业推理能力增强的通用强化训练方案。 5.销售、履约、医药和客服行业大模型训练。