logo of aliyun

阿里云阿里云智能-VPC高性能网络SRE高级开发工程师-杭州

社招全职3年以上云智能集团地点:杭州状态:招聘

任职要求


1. 计算机专业、网络技术等相关专业尤佳,3年及以上网络相关经验;
2. 精通Python编程语言,熟悉SQL语言,熟悉Linux系统常见的操作命令;具备阅读C/Java代码的能力;
3. 熟悉TCP/IP、BGP、VXLAN等常见的路由协议,并具备丰富的网络问题排查能力;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责阿里云云网络运维及稳定性能力建设,包括机制流程建设、风险运营、稳定性平台设计和开发等,保证阿里云云网络平稳可靠运行;
2. 负责设计并开发自动化运维工具链,通过AIOps技术优化VPC及公网产品的运维流程,输出标准化SRE工具,提升运维效能;
3. 负责线上紧急问题的快速响应,组织应急、实现线上问题的快速止血和逃逸,推动故障复盘与根因改进,沉淀应急处理SOP与灾备预案;
4. 负责云网络VPC和公网产品的线上运维和内部运营工作,搭建内部运营平台,实现工单、风险、缺陷等运营的标准化与自动化。
包括英文材料
Python+
SQL+
Linux+
C+
还有更多 •••
相关职位

logo of aliyun
社招3年以上诚云科技

1、稳定性保障与体系建设:负责大模型相关核心业务系统的稳定性建设工作,提升业务可用性与可靠性。 2、高并发流量治理:高并发场景下的流量治理方案设计与实施,包括熔断、限流、降级等容灾策略,确保业务弹性与鲁棒性。 3、运维流程优化和自动化:推动运维自动化与平台化建设,提升研发效率。 4、架构高可用建设:业务系统稳定性架构方案的设计与实施,推动高可用架构落地,规避系统性风险。 5、应急响应:负责快速定位并解决生产环境故障,建立故障快速恢复机制,推动长效改进措施落地。

更新于 2025-11-24北京|杭州
logo of aliyun
社招5年以上技术类-开发

1. 阿里云安全容器稳定性技术专家,负责构建安全容器线上稳定性能力,保障专属云等智算场景安全容器稳定性 2. 负责安全容器监控、诊断以及告警后端开发,保障阿里云安全容器pod、节点、网络和存储的高可用性 3. 负责利用数据科学、机器学习等技术优化运维流程,提升稳定性运维的自动化智能化水平和效率

更新于 2025-06-19杭州|上海
logo of aliyun
社招技术类-开发

1、负责AI智算场景VPC网络接入,低时延高吞吐的高速网络技术研发,以及在计算/存储/AI/机器学习/推荐等公司关键业务上的应用; 2、应用VPC高性能网络技术到虚拟机和容器网络,加速网络虚拟化场景; 3、通过DPU, 可编程硬件等, 推动高性能VPC技术在阿里云智算场景的大规模部等; 4、通过技术创新推动VPC网络技术的持续演进,打造下一代的超低时延高速VPC网络。

更新于 2025-05-22杭州
logo of aliyun
社招2年以上云智能集团

1. 负责阿里云面向AI智算场景的高性能云网络控制平面技术方案设计研发,包括技术可行性分析、方案选型、功能设计以及架构设计等工作; 2. 负责云网络VPC产品的产品全生命周期研发,为AI GPU计算、通用CPU计算提供高性能网络解决方案,并进行产品化研发落地; 3. 负责云网络VPC控制平面的技术实现,包括代码重构、控制面架构演进等; 4. 负责云网络VPC的稳定性能力建设以及性能优化,确保系统的安全可靠,提升产品稳定性和性能。

更新于 2025-08-13杭州