美团【LongCat大模型人才校招】Agentic Foundation Model 算法研究员
校招全职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘
任职要求
1.来自全球Top高校计算机科学、人工智能、数学、物理或相关领域应届博士/顶尖硕士毕业生; 2.在大模型领域有研究基础,或参与过有影响力的开源项目,在ICLR/NeurIPS/ICML/ACL等顶会发表论文具备扎实的算法和数学理论基础及良好的编程基础,熟悉自然语言处理、生成式AI和机器学习等技术,对技术开发及…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
大模型从通用问答走向复杂任务执行,Agent 能力正成为模型演进的关键方向。为此我们探索将通用基座模型向原生 Agentic Foundation Model 演进,为构建下一代自主智能体提供坚实的底座支持。团队在以下方向上进行探索,若你对以下一个或者多个课题感兴趣均欢迎投递: 1)大规模高质量数据体系与轨迹合成数据建设 1.建设 Trillion 级别的大规模跨模态数据处理与合成链路,负责从训练数据获取到配比建模的全流程优化。 2.探索大规模合成数据 与自蒸馏技术,制定合成数据应用策略,构建模型持续进化的数据飞轮。 2)长上下文 (Long Context) 与高效架构演进长窗口突破 1.持续 Scaling Up 模型的上下文窗口,优化超长上下文机制,重点提升 LongCat 基座模型在长上下文上的表现。 2.探索并验证 MoE(混合专家)、稀疏注意力(Sparse Attention)、线性注意力等模型结构;结合剪枝与稀疏化技术,协同优化训练与推理效率,提升超长上下文场景下的效率。 3)多模态能力融合 1.探索多模态预训练新范式,突破模态融合瓶颈。 2.利用多模态扩展定律指导数据与训练方案,提升模型在多模态交互场景下的原生能力。 【为什么是我们】 1.团队扁平,人才密度高,近年团队在ICLR、NeurIPS、ICML、ACL等顶会累计发表论文数十篇,团队员工获EMNLP 2024 Outstanding Paper、ACL 2025 Outstanding Paper; 2.参与大语言模型核心技术研发,接触大规模RL、超长上下文、分布式训练和推理优化等前沿技术; 3.充足算力保障,拥有大规模分布式训练环境和丰富数据资源。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
ICLR+
https://iclr.cc/
NeurIPS+
https://neurips.cc/
ICML+
https://icml.cc/
还有更多 •••