美团大模型引擎研发工程师(实习)

实习兼职核心本地商业-基础研发平台2025-04-07地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1. 有扎实的计算机理论基础，熟练掌握C++或Python语言
2.…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.围绕大模型异构训练集群，尤其是非NV GPU大规模异构硬件集群，面向大模型预训练、Finetune等场景进行新模型使能，系统分析/优化，业务支撑等工作，包括分布式优化框架，AI框架，网络集合通信，算子等方面内容；
2.负责大模型推理引擎的研发和优化，包括推理系统优化、模型量化压缩和模型部署；
3. 熟悉NLP类模型训练场景，有GPT，LlaMa、DeepSeek等相关知识和经验者优先
4. 熟悉视觉类，多模态大模型训练场景，有ViT， Swin Transformer, Stable Diffusion, MoE相关知识和经验者优先
5. 熟悉Megatron, Deepspeed, Colossal AI, FSDP等分布式框架，有相关知识、使用和调优经验者优先
6. 熟悉以下推理框架者优先，如FasterTransformer、vllm、sglang、LMDeploy、TensorRT-LLM等；
7. 熟悉PyTorch分布式场景，有二次开发经验，系统调优知识和经验者优先
8. 熟悉集合通信原理和基本知识，对NCCL有大规模使用，调优经验者优先
9. 熟悉算子开发流程，有CUDA编程知识和相关经验者优先
10. 熟悉NV GPU架构，对其他类型AI芯片有使用经验者优先

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+++

Python+

相关职位

大模型分布式训练引擎研发工程师（实习）

实习引擎

工作职责： 1、参与千亿级大模型的分布式强化学习 RL 训练框架研发，提升百卡~千卡级训练吞吐与资源利用率 2、参与 100B以上多模态强化学习算法流程适配（如DAPO等），各领域任务的 RL 正确性验证 3、实验并调优不同并行策略（Tensor/ZeRO/FSDP/Pipeline Parallelism）在超大规模模型上的最佳配置组合 4、协助定位分析分布式训练中的关键性能瓶颈（如GPU利用率低、显存瓶颈、网络通信阻塞、I/O延迟等），设计并实施优化方案进行验证。 5、参与研发/优化训练引擎的关键特性，如大规模集群下的稳定断点续训、高性能异步Rollout机制、以及高性能算子（Kernel）的集成与优化。

北京|上海

AI平台大模型部署系统研发工程师（实习）

实习引擎

核心职责：参与AI平台大模型推理部署等流程及工具的研发建设，完善平台现有功能。参与AI平台Quota管理模块的开发，实现多机房、多集群环境下的，各种异构计算资源的配额管理功能。参与AI平台联邦调度能力的设计和开发，与下游云原生团队共同实现平台联邦和弹性部署能力。

更新于 2025-10-14北京|上海

深度学习训练引擎研发工程师（实习）

实习机器学习平台

1、研发面向大语言/多模态/CV/NLP等类型模型的训练框架； 2、参与训练框架研发优化，包括分布式训练及微调工具链、训练性能优化、数据读取等AI基础设施的建设等； 3、与公司各算法部门深度合作，参与大语言模型、多模态大模型、计算机视觉、语音、自然语言处理等业务训推任务的优化提效； 4、深度参与周边深度学习系统多个子方向的工作，包括但不限于模型管理、推理部署、日志/监控、工作流编排等。

北京

【26届实习】深度学习推理/训练引擎研发工程师

实习机器学习平台

1、研发面向大语言/多模态/CV/NLP等类型模型的推理与训练框架； 2、参与推理框架研发优化，包括算子优化、推理架构优化、异构调度等多种技术研发落地等； 3、参与训练框架研发优化，包括数据读取、分布式训练及微调工具链等AI基础设施的建设等； 4、参与多个业务场景中的模型压缩技术实现，对模型进行轻量化压缩，提高训练/推理效率，支持业务降本增效； 5、与公司各算法部门深度合作，参与大语言模型、多模态大模型、计算机视觉、语音、自然语言处理等业务训推任务的优化提效； 6、深度参与周边深度学习系统多个子方向的工作，包括但不限于模型管理、推理部署、日志/监控、工作流编排等。

北京|上海