美团【LongCat大模型人才校招】基础模型 - 预训练

校招全职核心本地商业-基础研发平台2026-06-03地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1.熟悉NLP、LLM、MLsys、Optimization、OR、Control、RL等相关领域，对其中一个或多个方向有深入的研究经历，且有相关实际项目经验。
2.熟悉主流大模型技术熟悉PyTorch、 Megatr…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.探索下一代大模型训练范式，从模型结构、训练策略、数据策略、算力利用率等角度切入，打造具有更强能力和更高潜力的基座模型设计更高效的模型结构，提高给定数据量、计算量、硬件资源、序列长度等约束下的模型能力和潜力，如长序列能力、记忆能力、推理能力等。
2.探索更科学的训练策略，对影响training dynamic的关键变量（如学习率、batchsize、初始化等）形成更科学的认知。
3.探索更前沿的训练范式（如diffusion LLM，test-time scaling等具有潜力的技术），发现更高效和稳定的scaling路径。
4.研究模型结构和数据的耦合关系，优化分阶段训练范式。
5.研究模型早期表现和能力上限之间的关系。
6.结合MLsys解决大规模训练和推理中遇到的卡点问题，实现算法和工程联合设计。
【为什么是我们】
1.明确的技术判断：团队在原生多模态方向有非共识的长期投入，已发布 LongCat-Next 技术报告（离散自回归原生多模态），不是跟随式的能力补齐。
2.顶级资源支撑：5～6万卡计算集群，万亿参数文本基座已训练完成，多模态正在进行大规模上推验证——你将直接参与业界最前沿规模的多模态实验。
3.主线与探索并行：既承担多模态基座的核心交付工作，也推进下一代原生多模态架构的前沿探索，覆盖"数据→tokenizer→预训练→后训练→RL"全链路。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

NLP+

大模型+

PyTorch+

Megatron+

DeepSpeed+

vLLM+

还有更多 •••

登录查看完整学习资料