logo of aliyun

阿里云阿里云智能-文件存储研发专家-北京/杭州

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1、5年以上分布式存储系统或并行文件系统架构和研发经验。有丰富的系统设计和架构经验,能够设计高性能、高可用的存储架构方案。

2、深入理解并行文件系统的工作原理和架构,熟悉常见的并行文件系统(如Lustre、GPFS、GlusterFS等)…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责并行文件系统的架构设计,设计并实现高性能、可扩展的并行文件系统架构。参与关键模块的研发,主导高效的目录树架构和数据路径性能可扩展架构。

2、负责稳定性架构,系统在高性能的同时,具备面向失败的设计,建设稳定性工程能力,构建可观测系统,夯实稳定安全能力。
包括英文材料
系统设计+
高可用+
C+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术-开发

蚂蚁ASystem致力于打造下一代AI基础软件,并基于下一代的AI基础软件寻找通用智能的新方法,追求智能上限。 1、负责训推一体存储的设计与开发,建设面向训推一体的显存扩展和高性能数据存储方案,服务蚂蚁内部的强化学习场景; 2、负责整体性能优化与架构升级,通过存算结合持续提升训练/推理效率; 3、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-09-03北京|杭州
logo of aliyun
社招5年以上技术类-开发

1. 负责超大规模分布式块存储数据面系统架构、设计和研发工作,制定技术演进计划,保障技术竞争力和生产稳定性 2. 负责基于硬件基础设施进行软硬一体优化设计和调优,提供业界优秀的块存储性能 3. 针对公共云、非公共云等场景,进行块存储数据链路和分布式存储相关系统研发,确保稳定可靠高性能,和多场景下块存储能力输出的一致性和技术先进性

更新于 2025-04-15北京|杭州
logo of aliyun
社招5年以上云智能集团

1.构建盘古分布式文件系统的标准化输出能力,提高系统的自动化部署、运维能力; 2.梳理盘古分布式文件系统管控系统的依赖,降低对外部系统的依赖,建立运维管控系统回归测试能力; 3.重构盘古管控系统的数据层和逻辑层,确保系统在迭代更新的过程中始终保证兼容性和服务稳定; 4.对接阿里云安全体系和基础管控系统,确保系统能在多用户环境下安全稳定运行。

更新于 2025-09-11北京|杭州
logo of aliyun
社招技术类-开发

1. 负责智算高性能存储系统架构设计与开发,面向AI训练场景的高性能并行文件系统模块开发,设计多级元数据服务架构,支撑海量文件与高吞吐数据流。 2. 软硬件定义,机型设计,构建存算协同机制,实现GPU Direct Storage、KV Cache/Share,不断提升存储系统性能和减少计算。 3. 保障存储系统高可用与数据安全,通过分布式强一致性、同/异步复制提升数据可靠性,设计系统自愈能力应对磁盘/节点异常,增强系统可观测和易运维能力,并通过测试与故障注入得到验证。

更新于 2025-06-09北京|杭州