logo of alibaba

阿里巴巴基础设施与稳定性工程-AI Infra存储研发工程师-I/O缓存加速

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 计算机相关专业本科及以上学历,熟悉C++Golang,具备良好的算法与数据结构基础,有分布式存储、分布式缓存相关经验优先;
2. 熟悉RDMA等高性能网络编程技术,DPDK/SPDK等用…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们关注并负责建设高效、稳定的AI基础设施,为超大规模的分布式训练/推理提供低延迟、高吞吐以及高性价比的I/O链路优化及分布式存储方案。
1. 集团十万卡级别的混合云AI基础设施内的I/O链路优化,支撑大模型、搜推广等训练推理场景的海量小文件及超大吞吐读写等I/O需求;
2. 紧密结合集团基础设施,探索存算分离、存算一网等网络架构下优异的存储架构,以及跨DC的存储同步与全球数据编排;
3. 探索面向transformer模型架构(LLM\多模态等)的kv-cache大容量、超低延迟的存储与缓存设计,通过RDMA、多级缓存等技术,与计算引擎联合CoDesign,探索下一代“以存代算”和“以存强算”的I/O模式;
包括英文材料
学历+
C+++
Go+
算法+
还有更多 •••