logo of aliyun

阿里云阿里云智能-块存储管控系统研发专家-杭州/成都

社招全职5年以上云智能集团地点:成都 | 杭州状态:招聘

任职要求


1. 5年以上IT、互联网或云计算领域研发经验,精通JavaC++,具备大型服务端系统的开发实践。
2. 扎实的计算机基础,深入理解操作系统、IO模型、多线程编程、网络通信等核心机制,具备良好的代码设计与工程实现能力,能熟练运用AI辅助工具提升开发效率与代码质量。
3. 具备高并发分布式系统的设计、开发与调优经验,熟悉微服务架构、服务治理、弹性伸缩、容错降级等关键技术,能够构建可扩展、高可用的大型管控系统。
4. 熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责阿里云块存储管控系统的研发工作,为云服务器ECS、容器服务ACK/ACS、智能计算等核心业务提供低时延、持久化、高可靠的块存储支持,全面支撑AI训练、大规模容器集群等高性能云原生场景。
2. 承担块存储管控系统功能的全周期研发,包括需求分析、架构设计、核心开发、测试验证与发布上线,保障管控链路的高性能与高可用。重点提升系统在高并发请求下的弹性伸缩能力,优化资源调度效率与响应延迟。
3. 主导块存储管控架构的持续演进与重构,面向AI和容器等业务特点,推进系统解耦、故障隔离、容灾自愈等能力建设,降低爆炸半径,提升整体稳定性和可扩展性。通过端到端方案设计与跨模块协同,推动复杂技术问题的根本性解决。
4. 负责系统的稳定性保障工作,参与重大故障应急响应与根因定位,完成疑难问题排查与长效改进机制落地。结合运维数据与业务反馈,持续优化监控体系、诊断能力和自动化运维水平,提升系统可维护性与交付效率。
5. 打造面向未来的智能块存储控制平面,构建支撑大规模资源、具备云原生敏捷性的下一代存储管控架构。
包括英文材料
Java+
C+++
多线程+
高并发+
分布式系统+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 负责存储管控 & 数据面系统架构,分析和制定技术演进计划,保障技术竞争力 2. 负责基于DPU设计和开发存储控制面和IO协议栈,进行软硬一体协同优化,提供业界优秀的块存储性能 3. 负责基于DPU进行存储功能特性卸载,提升产品性能和产品竞争力 4. 负责设计和开发系统架构和校验机制,确保数据可靠性和系统可用性,保障系统安全和稳定性

更新于 2025-07-29杭州
logo of aliyun
社招5年以上技术类-开发

1、负责块存储运维支撑系统的的设计、开发工作,制定技术演进路线并保持技术持续迭代升级,进而保障超大规模分布式块存储系统的生产稳定性。 2、负责块存储生产运维规则基线的定义和开发,通过交付部署管控、发布变更管控以及智能检测熔断能力,提供稳定安全可靠的基础环境。 3、针对大规模分布式块存储系统,负责构建安全合规的可观测系统,包括机器、网络、用户、业务指标等各类监控,提供秒级的监控报警,并进行智能分析及根因定位。 4、负责运维能力的下沉,保障块存储运维支撑系统在线上线下能力的一致性。

更新于 2025-04-15北京|杭州
logo of tencent
社招3年以上CSIG技术

1.负责腾讯TCE专有云的运维保障,包括交付、监控、变更、应急响应和故障恢复; 2.负责腾讯TCE专有云站点建设、发布部署、监控巡检和变更管控等运维体系的建设,对效能提升有深刻的理解和实践; 3.为腾讯TCE专有云产品的稳定、高效运行负责,支撑专有云整体业务快速发展; 4.具备研发能力,通过研发解决运维体系的稳定性、效率和成本管理等问题。

更新于 2025-03-25深圳
logo of bytedance
实习A40006

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动基础架构存储团队,为字节跳动全系产品提供存储服务,对外打造火山引擎公有云存储产品体系。 在火山引擎,我们的云基础业务团队根植字节跳动最佳技术实践,通过丰富的存储产品矩阵,对外拥有数十万容器集群规模、数十万台服务器规模、EB级数据稳定存储的企业服务经验。我们积极探索业界顶尖的技术,致力于构建业界领先的云存储服务,为公司和客户发展保驾护航。 1、参与云存储产品(块、文件、对象、日志、消息队列)的功能特性开发; 2、参与云存储服务的线上运营运维工作,支持公司全线业务和外部火山引擎客户; 3、参与公有云、混合云的统一底座和管控中台建设,为ToB云产品提供统一的基础设施支持,支撑云产品对外输出; 4、参与持续优化系统稳定性、性能、成本、可用性、可扩展性、可维护性等工作。

更新于 2025-02-13上海