logo of alibaba

阿里巴巴AI推理平台-AI模型推理技术专家-北京/杭州/上海

社招全职2年以上地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 计算机/人工智能相关专业硕士及以上学历,熟练掌握C++Python编程语言,和软件工程面向对象设计(OOP,OOD)等相关技术, 有很好的抽象能力。
2. 掌握性能优化方法论,能够快速定位系统瓶颈的原因,能够利用Roofline Model来计算IO、计算和带宽的理论极限,并用编程技术逼近极限。
3. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


本团队涉及如下方面的工作:(工作内容可以根据候选人专业特长安排)
1. 多模态模型的推理功能开发和性能优化,包括对Qwen-3.6、Qwen-3.7、Qwen-VL、Qwen-Audio、Qwen-Omni等多模态输入/输出模型的功能支持和推理性能优化。
2. 分布式推理架构的研发,包括多机推理架构设计,P/D分离、A/F分离、VL模型分离架构、WideEP、ElasticEP等功能研发与落地。
3. 推理引擎服务化,包括推理引擎如何接入线上服务平台,自动扩缩容和可观测性的适配,以及提升线上服务稳定性。
4. NPU/GPU各类算子、kernel开发、算子融合、Compiler的开发等。
包括英文材料
学历+
C+++
Python+
面向对象+
还有更多 •••