米哈游Infra 推理优化工程师

社招全职程序&技术类地点：上海状态：招聘

扫码手机上打开

1. 具有一定的具备 GPU 性能优化经验，包括但不限于 CUDA/Cute/Triton/TileLang 等；
2. 扎实的系统与基础设施能力，熟悉 Linux 环境下高性能服务开发，具备良好的代码规范和系统设计能力；
3. 具备较丰富的大模型（LLM…

微信扫码，1秒登录

1. 设计并实现高可用的大模型服务化部署调度，支持多用户并发、低延迟、弹性伸缩；
3. 深入跟进团队内训练/推理相关的性能优化工作，解决实际业务场景中的性能瓶颈；
3. 持续跟进 AI Infra、分布式系统与推理优化前沿技术，推动新技术的验证与落地。

难度：

包括英文材料

CUDA+

Triton Inference Server+

还有更多 •••