logo of aliyun

阿里云阿里云智能-并行文件系统研发专家-杭州/上海

社招全职5年以上云智能集团地点:杭州 | 上海状态:招聘

任职要求


1、精通 C/C++Java,具有系统软件或分布式系统开发经验,熟悉至少一门脚本语言;
2、深入理解分布式系统容灾设计原理,有跨可用区系统开发或高可用架构设计经验者优先,熟悉 NVMe 协议者优先;
3、熟悉企业级文件系统、分布式文件系统或存储引擎的容灾机制,包含但不限于 Ext4, HDFS, GFS, Lustre, GPFS, Ceph, GlusterFS, JuiceFS, RocksDB 等;
4、5年以上云计算、互联网、 IT 开发相关工作经验;
5、工作态度严谨,有技术热情,具备良好的学习能力、沟通能力,团队协作和分析解决问题的能力。

工作职责


1、负责并行文件系统容灾设计与研发,构建并行文件系统的跨可用区容灾能力,设计并实现数据的多副本分布、服务的故障自动切换,并基于网络延迟进行拓扑优化;
2、负责并行文件系统的性能调优,参与各种复杂业务场景的分布式文件系统的设计与研发,实现和完善系统高可用、高可靠、高性能设计;
3、负责并行文件系统的稳定性,保障跨可用区架构在高并发场景下的稳定性,通过压测、故障注入、端到端容灾演练验证容灾效果,通过提升模块的可观测性、完善容灾 SOP 设计与验证等方式,实现系统的长期稳定运行。
包括英文材料
C+
C+++
Java+
分布式系统+
脚本+
高可用+
系统设计+
HDFS+
Ceph+
RocksDB+
相关职位

logo of aliyun
社招5年以上云智能集团

1、负责并行文件系统传输加密,构建并行文件系统的端到端加密框架,实现数据传输层的 TLS 加密; 2、负责并行文件系统的 NFS 协议研发,参与多机头 NFS v4.1 服务端协议状态机开发和维护; 3、负责并行文件系统的稳定性,保障加密模块与协议服务在高并发场景下的稳定性,通过压测、故障注入、端到端等测试验证加密对性能影响,并通过提升模块的可观测性、完善 SOP 设计与验证等方式,来实现系统的长期稳定运行。

更新于 2025-08-21
logo of aliyun
社招8年以上技术类-开发

1、负责应对各种复杂业务场景的分布式文件系统的设计与研发,包含高可用高可靠高性能设计,文件系统核心 IO 栈的研发; 2、负责高性能并行文件存储元数据的设计和研发,包含分布式元数据管理,分布式事务等关键技术,以及对应的稳定性工程,包括但不限于系统的可观测性、FaultTolerance、多租户 QoS系统研发。

更新于 2025-04-15
logo of aliyun
社招5年以上云智能集团

1、负责并行文件系统的架构设计,设计并实现高性能、可扩展的并行文件系统架构。参与关键模块的研发,主导高效的目录树架构和数据路径性能可扩展架构。 2、负责稳定性架构,系统在高性能的同时,具备面向失败的设计,建设稳定性工程能力,构建可观测系统,夯实稳定安全能力。

更新于 2025-09-05
logo of kuaishou
社招5年以上D8029

1、面向海量文件场景,提供高可靠、高可用、高性能的分布式文件系统服务; 2、解决分布式文件存储元数据管理、存储引擎、稳定性、性能上面临的各类挑战; 3、探索新一代分布式存储架构的设计及演化,保证低延迟和高吞吐。

更新于 2025-02-12