logo of meituan

美团【北斗】大模型算法工程师(服务零售)

校招全职核心本地商业-业务研发平台地点:北京 | 上海状态:招聘

任职要求


1.教育背景:计算机科学、人工智能、机器学习或相关领域的硕士或博士学位。
2.技术经验:熟悉深度学习算法及框架,如TensorFlowPyTorch等。对自然语言处理NLP)技术有深入理解,具备大语言模型的前沿研究经验。具备超大规模模型架构设计与优化的经验,熟悉Transformer及其各种变体。
3.研究能力:有前沿技术的研究经历,如稀疏激活、混合精度训练、多任务学习或跨模态理解。能够进行创新性思考,探索并提出新的算法或架构以提升模型性能。具有强化学习算法设计与实现经验,尤其是在后训练阶段应用。
4.协作与沟通:具备跨部门合作的能力,能够与数据科学家、算法工程师、工程团队以及产品团队紧密沟通。能够将研究成果有效转化为实际应用,并推动技术落地。
5.责任心与学习能力:具备高度的责任心及自我驱动力,能够持续学习并适应快速变化的新技术。

岗位亮点:
1.和前沿技术的紧密接触,并创造影响:投身于最具革命性的AI Agent、AI Coding赛道,有机会重构生产关系与研发范式。同时你的研究工作将直接影响数万开发者的生产力、有机会改造C端用户的交互体验。
2.充分授权,没有那么多的条条框框:充足的资源和良好的工作自由度,探索最具挑战性的技术问题,目标是产出有影响力的工作,解决业务实践中的问题。
3.有机会接触司内外的牛人,并一起干事业:资深技术导师全程指导,与公司数据科学家、算法工程师、工程团队、产品团队紧密合作,将研究成果快速转化为实际应用,推动大语言模型在更多场景的落地。

工作职责


以大模型对话技术为核心,探索前沿技术问题,研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手,实现“技术驱动业务范式”的升级转变,最终助力商业价值全面提升。
研究方向一:Agent能力增强
基于Agent的用户助理,研究提升Agent自主规划能力,并通过Agent构建和基于后训练的优化,实现数字助理的能力复刻和增强。
研究方向二:强化学习算法研究
参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。
研究方向三:垂域模型定制化构建
领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。
研究方向四:精准上下文理解与长程依赖建模
研究如何高效、准确地捕获和利用复杂的项目级上下文信息(如整个代码库、依赖关系、API文档、Issue跟踪等),探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法,以支持更精准、更全局的代码智能,从而提升业务研发在存量代码中迭代的效率。
包括英文材料
机器学习+
学历+
深度学习+
算法+
TensorFlow+
PyTorch+
NLP+
系统设计+
Transformer+
强化学习+
AI agent+
C+
相关职位

logo of meituan
校招核心本地商业-业

1.参与美团全球化业务中智能客服、智能审核、智能外呼等核心场景的大模型应用研发与落地工作。 2.针对跨文化、多语言、少样本等复杂业务挑战,研究并应用强化学习、多模态学习、高效后训练等前沿技术,对大模型进行深度优化与能力增强,提升模型在实际业务中的表现。 3.主要研究方向包括但不限于: a. 任务型对话技术攻关: 研究强化学习与高效后训练方法在多模态任务型对话中的应用,优化全球用户的复杂服务请求处理与任务达成效果。 b. 少样本多模态理解与推理: 探索在海外数据稀疏环境下,通过少样本学习等手段构建强大的多模态理解与推理能力,支持高效合规审核及风险识别。 c. 可控对话生成与知识融合: 面向智能外呼等场景,研究多语言环境下可控对话生成及知识融合技术,提升沟通的自然度、准确性和业务转化率,并追踪前沿技术动态,推动创新落地。

更新于 2025-05-23
logo of meituan
校招核心本地商业-业

研究方向一:垂域LLM研究与构建​ 1.基座模型架构设计与优化:参与大语言模型基座架构的设计,研究前沿技术,如稀疏激活、混合精度训练等,同时优化模型的训练和推理流程。​ 2.技术创新与突破:参与前沿技术研究,如多任务学习、跨模态理解等,推动模型在复杂任务上的性能提升;探索Transformer替代架构,突破现有模型scaling law限制;同时挑战学术benchmark,为模型的性能树立新的行业标杆。​ 3.强化学习算法研究:参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。​ 4.垂域模型定制化构建:领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。​ 5.跨部门协作与落地:与公司数据科学家、算法工程师、产品团队紧密合作,将研究成果快速转化为实际应用,推动大语言模型在更多场景的落地。​​ 研究方向二:垂域MLLM研究与构建​ ​1.研究多模态表征与大语言模型融合的前沿技术,设计和实现创新算法,研究异质数据的统一编解码模型,适配多种模态下的特征统一,实现高效微调与优化。​ 2.探索强化学习(RL)在多模态大模型中的应用,包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化,提升多模态理解与推理能力。 ​3.持续追踪多模态与强化学习结合的最新研究进展,优化现有多模态系统架构,提升性能、效率与可扩展性,推动多模态强化学习在智能体交互、决策推理等任务中的应用。 ​4.构建技术评估体系,通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用,提升多模态大模型的泛化能力和实际应用价值。​​ 研究方向三:基于角色扮演的虚拟数字助理 ​​1. 角色扮演技术(Role-Playing):通过模型优化、Agent构建,在人设、拟人性、情感等取得显著提升。 ​2. 记忆管理与增强(Memory):通过模型长上下文,记忆抽取与管理,提升系统的记忆能力。 ​3. 个性化技术:通过用户行为数据挖掘与建模,结合多轮对话上下文理解,分析用户情感状态,提升模型的个性化回复能力。 ​4. 基于Agent的数字助理:通过Agent构建和基于RL的优化,实现数字助理的能力复刻和增强

更新于 2025-05-23
logo of meituan
校招金融服务平台

负责金融场景的大模型的研发和应用,研究相关技术在AI营销、AI风控、AI客服、AI催收领域的落地价值和解决方案,通过AI赋能业务,满足业务迅速增长的智能交互、智能决策需求。 研究方向一:基于大模型的多轮对话理解与生成 1.深入参与对话机器人在数据建设、指令微调、偏好对齐、强化学习、推理优化等环节的建设; 2.研究和解决大模型落地的关键问题,如检索增强、长文本理解、模型小型化技术等,并提升训练-评测的迭代效率。 研究方向二:大模型智能体算法研究 1.负责基于大模型的智能体架构构建,实现复杂问题的理解规划、工具执行以及感知反思能力; 2.探索最前沿技术,设计算法迭代飞轮,优化大模型基础模型,高效提升模型效果; 3.负责多智能体架构设计与落地,在多个金融业务场景中应用。

更新于 2025-05-23
logo of meituan
校招核心本地商业-点

1.深入参与行业内主流大模型落地场景的技术迭代,包括:生成式检索/推荐、RAG、推理优化等,持续提高模型的推理性能与效果; 2.跟进Deep Research,Agent RL等前沿技术,并在点评搜推以及大模型应用场景中探索落地,持续改善用户体验。

更新于 2025-05-23