logo of aliyun

阿里云阿里云智能-文件系统开发专家-AI领域-杭州/上海

社招全职5年以上云智能集团地点:杭州 | 上海状态:招聘

任职要求


1. 编程基本功扎实,精通C/C++,熟悉至少一门脚本语言;
2. 熟悉传统企业级文件系统、分布式文件系统或各类存储引擎者优先,包含但不限于 Ext4、HDFS, GFS, Lustre, GPFS, Ceph, GlusterFS, RocksDB等;
3. 具有高并发和超大规…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责文件系统核心 IO 栈的研发,参与数据路径和元数据路径的技术方案设计和研发,以及规模、性能、成本优化;
2. 负责分布式文件系统的稳定性和质量,包括但不限于系统的模块可观测性、FaultTolerance、确保数据正确性和系统稳定性;
3. 参与各种复杂业务场景的分布式文件系统的设计与研发,实现和完善系统高可用、高可靠、高性能设计。
包括英文材料
C+
C+++
脚本+
HDFS+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

智算存储技术开发专家将负责开发阿里云智算存储的数据的备份,容灾,同步,分层,治理子系统的研发,日常工作包括但不限于: 1. 设计和开发针对智算数据的大规模分布式数据保护与管理系统,包括但不限于数据重删,压缩,存储,复制,归档,分析功能,同时对系统的监控和运维能力负责,保证系统安全性和可靠性; 2. 测试,调优和运维大规模公共云服务和分布式存储系统; 3. 保持前瞻性, 随着业务复杂性, 负载增加, 运行管理复杂性的增加, 持续的推动系统设计的重构。

更新于 2025-11-23北京|杭州|上海
logo of aliyun
社招5年以上云智能集团

1. 负责高性能并行文件系统中,新型存储介质、RDMA 网络相关性能分析工具开发和性能验证; 2. 结合存储硬件演进,负责并行文件系统的存储引擎在性能、成本、稳定性多维度的持续优化; 3. 与硬件团队合作进行软硬件结合设计,负责相关的存储软件设计和性能优化。

更新于 2025-11-23杭州|上海
logo of aliyun
社招5年以上云智能集团

1. 负责文件存储可观测性指标体系设计实现,定义监控指标埋点和采集流程标准、定义产品全链路关键性能指标、实现数据和元数据全链路请求追踪方案、构建多层级监控体系,支持实时监控与历史趋势分析。 2. 负责文件存储异常诊断系统,基于可观测性指标体系开发故障根因分析和定位能力,基于 AI Agent 构建故障分析和故障处理方案智能推荐。 3. 与客户支持团队对接,提供可观测工具,辅助 SRE 团队快速响应客户问题。

更新于 2025-11-23杭州|上海
logo of aliyun
社招5年以上云智能集团

1. 负责文件存储管控系统中资源管理,权限管理,数据管理和运营系统的开发工作; 2. 优化CPFS 产品的资源模型,负责AI Storage新一代的资源管理框架,满足智算场景下各类规模客户的资源管理诉求; 3. 参与建设文件存储管控系统的高可用体系,包括流量均衡、自适应容灾、故障自动化处理等,确保业务持续可用、保障线上系统稳定及安全合规能力; 4. 持续提升文件存储管控系统的用户体验,深入理解文件存储的业务,解决客户使用文件存储产品中的痛点和难点,改进不合理的设计,提升产品易用性。

更新于 2025-11-20成都|杭州|上海