logo of aliyun

阿里云阿里云智能-存储运维系统研发专家-杭州/上海

社招全职5年以上技术类-开发地点:杭州 | 上海状态:招聘

任职要求


1、5 年以上的大规模集群实战运维经验,具有知名运维系统使用、开发经验者优先。
2、 熟悉软件开发和系统架构,掌握至少一门编程语言,python 或者 go 优先。
3、系统工程能力扎实过硬,了解服务器和 linux 系统及网络、存储软件栈等上下游链路。
4、熟悉系统部署、监控告警、异常发现、可视化分析展示等运维系统建设,有把重复性工作简化成代码的习惯。
5、具有良好的团队协作、沟通能力,良好的客户服务意识。
6、具有分布式存储背景者优先。

工作职责


1、负责运维管控系统子模块设计和研发工作,如部署升级系统、根因分析系统、监控告警体系、故障自愈系统等。
2、负责可观测性平台系统的设计和研发工作,提升服务质量和系统的可观测能力。
3、制定交付标准和运维规范,通过自动化的方式,提升系统运行的效率及稳定性。
包括英文材料
Python+
Go+
Linux+
相关职位

logo of aliyun
社招5年以上云智能集团

1、负责运维管控系统子模块设计和研发工作,如部署升级系统、根因分析系统、监控告警体系、故障自愈系统等。 2、负责可观测性平台系统的设计和研发工作,提升服务质量和系统的可观测能力。 3、制定交付标准和运维规范,通过自动化的方式,提升系统运行的效率及稳定性。

更新于 2025-08-06
logo of aliyun
社招5年以上云智能集团

1.负责存储索引中台的核心功能设计与研发,包括但不限于:路由/调度、分片管理(split/merge)、负载均衡与容灾切换。 2.构建多集群/联邦化管控:统一命名/注册发现、跨集群路由、在线再均衡与无感迁移。 3.持续性能剖析与优化(perf/eBPF/火焰图),在真实流量与压测环境下定位瓶颈、落地优化方案。 4.完善系统可观测性和运维能力、混沌演练、容量与变更发布策略,保障高可用与可回滚。 5.参与 CPFS 问题排查与稳定性治理,沉淀工具与最佳实践。

更新于 2025-08-25
logo of aliyun
社招5年以上云智能集团

1. 设计,开发和调优混合云存储产品的数据平面,包括但不限于Guest OS/Hypervisor/存储网关/阿里云等层面上的存储,备份,数据服务,容灾恢复等核心功能的数据平面能力; 2. 推动技术与业务的发展,在专有云与公有云中设计和开发不同形态的混合云服务; 3. 产品负责人岗位需跟踪协调合作伙伴产品(例如网关)功能和进度制定阿里云相应的功能适配;制定自主研发混合云存储产品的数据平面技术架构选择、开源和自研模块集成策略。

更新于 2025-07-31
logo of aliyun
社招5年以上技术类-开发

1. 参与 PB 级分布式引擎设计与开发,包括存储、索引等的功能实现与性能和成本优化; 2. 参与稳定性建设,优化分片调度与负载均衡机制,研发不同高可用产品形态,包括:同城多可用区、异地容灾、全球多活等; 3. 跟踪业界前沿动态,学习和吸纳开源的大数据计算和存储技术,帮助产品探索和实现更多的玩法。

更新于 2025-04-15