logo of meituan

美团【北斗】搜索算法研究员(需求理解/供给理解/匹配能力)

校招全职核心本地商业-业务研发平台地点:北京状态:招聘

任职要求


1.计算机科学、人工智能、软件工程等相关专业硕士或博士,具备扎实的算法数据结构及编程能力,熟悉主流深度学习框架(如PyTorchTensorFlow等)。
2.深入理解自然语言处理NLP)、信息检索(IR)、机器学习等领域的核心理论与方法,熟悉搜推广系统、自然语言处理、生成式大模型强化学习等至少一个领域,对AI技术充满好奇心,关注领域前沿进展。
3.具备实际数据处理能力,能够独立完成数据清洗、特征工程、模型训练与调优,具备良好的分析与解决复杂问题的能力。
4.具备良好的工程实现能力,能够将算法模型有效落地至实际系统,对高性能、高可用性系统有一定理解。
5.具备优秀的团队协作能力和沟通能力;对电商场景有基本认知,愿意深入理解用户需求与商业逻辑,将技术方案转化为业务价值。
6.在顶级学术会议/期刊(如SIGIR、WWW、KDD、RecSysWSDM、ACL、EMNLP、NeurIPS等)有论文发表或国际或国内权威赛事或评测(Kaggle/ACM/KDD Cup等)中取得优秀名次者优先。

岗位亮点:
1.作为国内外领先的本地生活平台,亿级DAU、海量的用户/商户数据、复杂的业务场景,挑战算法的极限并提升个人技术能力,拥有广阔的技术创新空间和应用前景。
2.充足的算力资源,可以亲自上手训练能在工业界落地的千亿级参数大模型。
3.团队技术卓越,发表多篇顶会论文,技术交流分享氛围浓厚,支持进行前沿技术与业务探索,加入优秀的团队,一起快速成长。
4.专业的成长体系,完善的"导师+项目+课程"三维成长体系,配备个性化技术成长路径,定期组织Paper Reading、Tech Talk与顶会论文复现研讨会。

工作职责


​研究方向一:基于时空场景感知的用户全域意图理解​
1. 时空动态感知与即时需求捕捉,用户意图受地理位置(如商圈变化)、时间(如节假日/天气)、实时场景(如突发疫情)等多维度动态因素影响。​
2. 多模态行为语义对齐与意图蒸馏,用户行为存在显性交互(点击/收藏)与隐性表达(页面停留/滑动速度)的多模态断层,且跨业务场景(到店/到家)行为模式差异显著。
​3. 隐私安全的多场景知识融合,到店、到家等业务场景数据隔离导致用户认知碎片化,且需符合数据安全合规要求。​​
研究方向二:多模态供给理解与动态表征建模 ​
​1. 异构供给的统一语义建模,异构供给(商家/商品/服务/内容)的多模态信息融合难题,需解决文本、图像、视频等跨模态语义对齐与联合表征。​
2. 实时供给状态感知与动态更新机制,如库存/价格/服务能力等高频变化要素的即时捕捉。
​3. 领域知识增强的供给深度理解,构建覆盖本地生活全场景的细粒度知识图谱。
​​研究方向三:端到端生成式搜索系统的构建与优化​
​1. 端到端生成搜索架构构建,解决传统搜索系统"召回→粗排→精排→重排"多阶段解耦带来的信息损失问题,建立统一生成框架下的多目标联合优化机制;设计新型生成式排序范式,融合Scaling Law原理实现语义空间与行为空间的联合表征。​
2. 生成结果的可控性与可解释性,构建多粒度约束解码机制,将业务规则、供给状态、合规要求等硬约束编码到生成过程中;同时设计基于强化学习的偏好对齐框架,实现生成质量的双重控制。
​3. 实时推理性能优化,攻克大模型长序列处理的性能瓶颈,研发基于Attention稀疏化和状态复用的流式生成技术;设计轻量化验证网络,在保证生成质量的前提下将推理延迟降低至毫秒级,支撑亿级DAU场景。
包括英文材料
算法+
数据结构+
深度学习+
PyTorch+
TensorFlow+
NLP+
信息检索+
机器学习+
大模型+
强化学习+
特征工程+
高可用+
RecSys+
WSDM+
NeurIPS+
Kaggle+
相关职位

logo of meituan
校招核心本地商业-业

研究方向一:基于生成式推荐的CTR预估新范式 该方向研究在生成式推荐架构下,如何发挥算力优势,重构当前搜推排序架构体系,实现有限资源下累计收益最大化。关键问题如下: 1.在训练、推理上发挥生成式架构算力优势:针对超长用户行为序列探索生成式架构下Scaling Law,基于美团LBS特点高效捕捉用户兴趣。 2.建设全场景生成式推荐算法:基于超大算力的生成式架构,建设多业务线统一排序算法;采用预训练+SFT、KV Cache等技术,建设多业务下统一的训练、推理服务架构。 3.全链路端到端统一建模:利用生成式架构优点统筹多阶段漏斗,彻底改变当前繁重的多阶段迭代模式,建设出既能互相协同与配合、且目标又充分一致的新算法链路。 研究方向二:面向即时零售场景的大模型驱动用户兴趣建模与场景化推荐方法研究 随着大语言模型(LLM)在自然语言处理、知识推理等领域的广泛应用,如何将其与零售业务深度融合,提升即时零售场景下的用户兴趣理解与个性化推荐水平,成为智能推荐领域的重要研究方向。本课题旨在突破传统推荐系统对用户兴趣建模的局限,充分挖掘大模型的语义理解、知识推理与泛化能力,推动零售行业智能化升级。关键问题如下: 1.探索并实现大模型与零售业务领域知识的高效融合机制,系统评估监督微调(SFT)、检索增强生成(RAG)等多种集成方案在场景化推荐中的适用性与性能表现。 2.构建面向即时零售场景的用户兴趣建模体系,利用大模型对用户行为、商品属性、场景上下文等多维数据进行深度语义建模,提升用户兴趣刻画的准确性与动态性。 3.研发场景化推荐推理框架,基于大模型的推理能力,实现对用户个性化需求的精准预测与推荐,显著提升即时零售平台的用户体验和转化效率。

更新于 2025-05-23
logo of meituan
校招核心本地商业-基

通用Agent方向: 1.探索模型通过 RL Scaling 等方式使用成套工具解决复杂问题的行动和规划能力,包括 Human in the Loop 多轮交互下 Agent 基础建模的新方案、以及与复杂环境的交互学习能力; 2.探索模型在 Non-Rule Based Outcome 场景下利用复杂信息进行有效推理的范式,包括 Proactive Agent 的建模方案; 3.探索研究更多内在奖励的机制,从而激发模型主动学习和自我更新的能力; 4.探索构建长期记忆机制,为下一代高效的推理模型、长序列推理及建模提供基础。 搜索Agent方向: 1.参与通用AI搜索中Agent的框架建设和算法优化,并能在实际业务场景进行落地; 2.探索指令微调、偏好对齐(RLHF/DPO)和LLM Reasoning(如思维链、多步推理)在AI搜索场景的应用,特别是提升复杂搜索能力(如Deep Research); 3.构建端到端Agent优化系统,将意图识别、推理规划、工具调用、信息检索和结果生成等步骤联合优化,探索大模型AI搜索Agent的智能上限; 4.研究AI搜索Agent的自动评测标准和方法,构建公平、合理并且全面的评测系统加速Agent迭代; 5.跟踪大模型和搜索最前沿的技术,包括但不限于多模态、Scaling Law、训练范式探索、长文本优化、高效训推框架探索。 安全方向: 1.负责LLM、VLM通用大模型与垂类大模型的内容安全研发,提升模型识别风险、规避风险、处置风险的能力。 2.负责通过定性、定量方法评估策略表现,进行策略迭代更新,不断提升内容安全效果。 3.深度参与大模型、安全、算法等领域的调研,结合通用模型的新技术、新场景,如LongCoT、Agent、GUI,积极探索相应新技术、新场景上,安全方案的创新和落地。

更新于 2025-05-23
logo of meituan
校招核心本地商业-基

美团大模型评测团队以指引通往AGI的道路为目标,深耕模型评测研究,系统性的理解大模型当前能力水平及未来技术发展方向,并以此为基础完善模型评测能力矩阵。团队工作方向包括但不限于: 1.构建科学有效的评测方案,为现阶段大模型提供有效的评测和分析手段,并面向未来模型储备评测技术,包括人机协同评测、产品化隐式评测方案、全模态交互式评测方案等; 2.结合模型训练过程和评测结果,对模型的能力进行建模及深入的理解和研究,包括能力体系构建、训练阶段分析、模型能力/问题溯源等; 3.探索模型能力边界,发现当前模型训练范式的局限性,寻求模型能力突破,包括异步交互、记忆管理、自主学习、具身智能等。 本岗位涉及的模型及方向包括: 1.面向下一代文本模型的评测与探索,包括但不限于:完善推理系模型的评测框架,引入推理效率相关的评测指标等。 2.面向多模理解与生成能力评测与探索,包括但不限于:全模态及跨模态交互能力,世界模型与具身智能能力。 3.面向模型Agent能力的评测与探索,包括但不限于:模型的任务规划、工具使用、环境反馈、自主决策等通用Agent能力,及Computer Use、Code Agent、通用搜索等产品级Agent方向。 4.长周期人机协作与Agent能力边界探索,包括但不限于:Agent的异步交互、适时思考、记忆管理、自主学习等能力的评测方案及实践探索。

更新于 2025-05-23
logo of meituan
实习核心本地商业-基

随着大模型与生成式 AI 技术的快速发展,在多模态和复杂场景下让 Agent 具备更强大的决策和执行能力成为未来的重要趋势。OpenAI Operator 通过结合强化学习的多步决策机制与大模型的理解、推理优势,可在多种任务场景(如 Computer Use、网页浏览等)中实现高效且灵活的自动化决策和任务执行。本课题将聚焦多样化业务场景和复杂环境下的自适应策略设计、规划与推理,进一步提升 Agent 在真实应用中的表现。 主要研究内容包括但不限于: 1) 多模态与多步决策:设计并构建包含多模态信息、计算机交互、网络搜索、函数调用等多维度的复杂环境,研究如何利用端到端强化学习来进行多步决策,从而完成更具挑战的任务。 2) 策略学习与优化:在多种强化学习算法(如 PPO、GRPO 等)的框架下,探索高效的策略优化方法,为 Operator Agent 提供强大的决策和执行能力。 3) 规划与推理:借助大模型的知识与推理能力,设计可解释的多步规划算法;研究如何与外部工具或知识库交互,以扩展 Agent 的能力边界并提升其在真实环境中的自动化决策表现。

更新于 2025-05-23