美团【北斗】基座大模型算法研究员（Reasoning）

校招全职核心本地商业-基础研发平台2025-05-23地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1.计算机科学、人工智能、自然语言处理、强化学习、数学等相关领域专业；
2.扎实的机器学习、NLP、RL等相关领域基础，对其中一个或多个方向有深入的研究经历，发表过高水平论文优先（如NeurIPS,ICLR,ICML,ACL,EMNLP,ICRA,IROS,CoRL等）；
3.优秀的代码能力、数据结构和基础算法功底，熟练Python、C++等至少一门编程语言，熟悉LINUX环境，ACM/ICPC、NOI/IOI、Kaggle等…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.探索生成式模型的高级推理发生机制，提升大模型在复杂任务上的推理表现。包括但不限于RL scaling、Test time scaling等；
2.探索模型通过使用工具扩展能力边界，同复杂环境交互持续提升模型智能水平；
3.超大规模模型的强化学习性能优化，通过算法/工程的联合优化，极致加速模型训练和推理。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NLP+

强化学习+

机器学习+

NeurIPS+

ICLR+

ICML+

还有更多 •••

登录查看完整学习资料

相关职位

【北斗】多模态基座大模型算法研究员（视觉/语音/全模态融合）

校招核心本地商业-基

视觉方向 1.探索大规模/超大规模多模态视觉大模型，并进行极致系统优化，数据建设、指令微调、偏好对齐、模型优化。 2.探索统一的多模态大模型架构，打通理解与生成之间的壁垒，研究如何在单一模型框架下实现对多模态信息的深度理解与高质量生成。 3.探索多模态推理模型（Reasoning）架构、提升多模态在学科、通用视觉任务上的思考和推理能力。 4.探索视觉GUI Agent模型构建，提升GUI场景下的理解、规划和决策能力，进而提升人机交互的性能。 5.探索具身智能大模型的构建，提升机器人在物理场景中的模仿学习和强化学习算法，提升具身智能的多模态处理能力以及与开放世界的物理交互能力。 6.探索多模态视觉大模型后训练方法，探索指令微调、强化学习等后训练策略，提升模型的性能。语音方向 1.语音表征学习：探索同时适用于理解和生成任务、兼顾学习效率和效果的语音表征。 2.模型结构与预训练方法：研究可大规模扩展的模型结构，高效学习语音和文本知识，提升模型的理解和生成能力。 3.音频理解：在语音(Speech)之外，探索更广泛的音频（Audio，如音乐、环境声）理解能力。 4.音频生成：探索高质量音频生成能力，具备强表现力、多风格、多语种、多音色等。 5.后训练方法：探索基于 SFT 和 RL 的后训练策略，进一步提升模型能力上限，。 6.智能交互技术研究，探索高效的智能交互技术，增强系统交互过程中的智能能力、拟人度、自然度和主动性。全模态融合大语言模型最近取得的突破，加速了多模态大模型的发展。全模态大模型（Omni-MLLM）通过融入如视觉、语音等模态，拓展了多模态大语言模型的能力，有助于更全面、多维度地理解与生成各种模态，提供更强的智能以及更智能的交互模式。 1.多模态表征对齐：研究在统一模型架构下提取并共享视觉、语音、语言等模态的特征；基于对比学习、自监督学习，优化多模态对齐过程；针对视频、音频等数据，研究时间序列信息的对齐技巧。 2.多模态统一模型架构：探索统一全模态大模型架构，研究高效全模态预训练技术，使之能够高效处理文本、图像、视频和语音数据，并生成涵盖文本、音频和图像等多种模态的输出 3.多模态知识迁移与能力增强：研究在不同模态间的能力迁移，激发模型在跨模态任务中的涌现能力。

更新于 2025-05-23北京|上海|深圳

【北斗】基座大模型算法研究员（通用 Agent/搜索Agent/安全方向）

校招核心本地商业-基

通用Agent方向： 1.探索模型通过 RL Scaling 等方式使用成套工具解决复杂问题的行动和规划能力，包括 Human in the Loop 多轮交互下 Agent 基础建模的新方案、以及与复杂环境的交互学习能力； 2.探索模型在 Non-Rule Based Outcome 场景下利用复杂信息进行有效推理的范式，包括 Proactive Agent 的建模方案； 3.探索研究更多内在奖励的机制，从而激发模型主动学习和自我更新的能力； 4.探索构建长期记忆机制，为下一代高效的推理模型、长序列推理及建模提供基础。搜索Agent方向： 1.参与通用AI搜索中Agent的框架建设和算法优化，并能在实际业务场景进行落地； 2.探索指令微调、偏好对齐（RLHF/DPO）和LLM Reasoning（如思维链、多步推理）在AI搜索场景的应用，特别是提升复杂搜索能力（如Deep Research）； 3.构建端到端Agent优化系统，将意图识别、推理规划、工具调用、信息检索和结果生成等步骤联合优化，探索大模型AI搜索Agent的智能上限； 4.研究AI搜索Agent的自动评测标准和方法，构建公平、合理并且全面的评测系统加速Agent迭代； 5.跟踪大模型和搜索最前沿的技术，包括但不限于多模态、Scaling Law、训练范式探索、长文本优化、高效训推框架探索。安全方向： 1.负责LLM、VLM通用大模型与垂类大模型的内容安全研发，提升模型识别风险、规避风险、处置风险的能力。 2.负责通过定性、定量方法评估策略表现，进行策略迭代更新，不断提升内容安全效果。 3.深度参与大模型、安全、算法等领域的调研，结合通用模型的新技术、新场景，如LongCoT、Agent、GUI，积极探索相应新技术、新场景上，安全方案的创新和落地。

更新于 2025-05-23北京|上海

硬件开发工程师

社招5年以上软硬件服务-骑行

1、负责共享两轮车电气件的硬件开发。 2、根据产品需求完成电气系统设计、硬件方案设计，编写设计文档。 3、负责关键电子元器件物料选型、原理图绘制和电路板布局布线，BOM确认，进行样板焊接和调试。 4、配合软件、结构、测试等部门完成产品开发和产品验证，跟进并解决生产问题。 5、跟踪存量产品的市场问题，制定并落地解决方案。 6、跟踪行业新标准和技术动态，参与新技术预研和应用。

更新于 2025-04-01深圳|北京

高德-高级技术专家（交易/营销方向）-高P专项

社招6年以上技术类-开发

信息工程介绍：构建空间智能商业引擎，支撑高德日均调用北斗定位4800亿次，我们在商业服务领域面临多重极端技术挑战；节假日搜索系统需承载超百万QPS峰值请求，同时保障更新99.999% SLA；实时管理海量动态服务节点（从充电桩状态到酒店房态），时空数据更新毫秒级延迟。 1、提升交易稳定性、数据一致性、缩短RT等； 2、业务层面打造交易平台，支持业务快速试错、迭代，提升产研效率，快速助力业务KPI的达成。 3、负责高德基于LBS本地生活类业务（例如：酒店、门票、加油充电、美食生服）的营销运营体系建设，营销引擎、增长相关系统研发和迭代。 4、参与系统稳定性保障体系的建设，包括系统风险识别与优化、稳定性工具沉淀，保障大促及平时业务系统稳定、高效运转 5、负责协调上下游团队，推动项目高效、有序落地。

更新于 2025-06-27北京