logo of alibaba

阿里巴巴基础设施与稳定性工程-高级基础平台研发专家-文件系统存储方向

社招全职8年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 熟悉大语言模型、生成式AI模型的训练、推理的I/O 特性及对存储系统的需求。
2. 熟悉大数据系统、机器学习系统领域内业界主流的持久化存储及缓存系统,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 研发针对各AI训推业务的缓存加速系统,充分利用HBM、NVMe SSD等计算集群的高速存储介质及RDMA通信带宽,提高AI训推计算效率与性能,为集团AI业务的端到端的io性能、稳定性负责。
2. 在持久化存储基础上,利用计算集群的存储介质建设统一的日志文件系统。
3. 通过对文件存储层进行完善,强化文件系统存储能力,改善存储空间和数据读写速度,推动提高计算效率与性能。
包括英文材料
机器学习+
缓存+
还有更多 •••