logo of didi

滴滴业务稳定性-Cuenta SRE 骨干(JR20260626001)

社招全职3年以上技术地点:杭州状态:招聘

任职要求


1、3 年以上 SRE / 稳定性 / 运维开发经验,或资深研发工程师转稳定性方向,有大规模在线服务系统的稳定性保障与架构设计经验,对系统稳定性保障有全面深入的理解。
2、扎实的研发功底,至少精通一门主流语言(Go / Java / Python),能做工具化与自动化;扎实的故障定位与应急处置…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、贴身业务、为一条业务线的稳定性负责:深入理解Fintech业务线(如支付业务/Cuenta数字银行 / 现金贷 / 信用卡 / 先买后付/99pay),作为稳定性owner,围绕可用性、连续性与安全目标,挖掘业务风险、沉淀稳定性标杆,对该线   SLA/SLO、MTTD/MTTR 负责。
2、构建主动防御与快速止损能力:建设监控预警、根因定位、链路分析能力,沉淀降级、限流、熔断、一键预案等止损手段,推动从"被动救火"到"主动防御"。   
3、变更与发布管控:主导/参与核心变更评审,识别高危变更;负责 P0/P1 发布的方案制定与值守,守住发布质量。
4、7×24 oncall 与应急:参与业务线 oncall 轮转,快速定位止损;主导/参与故障复盘,闭环改进项。
5、核心链路梳理与容灾:摸清关键链路与依赖,识别单点,推动容灾、弹性等架构演进,提升业务可用率。
6、智能运维与提效:结合 AI 与自动化能力提升保障效率,推动监控自愈、智能诊断等能力落地。
包括英文材料
系统设计+
Go+
还有更多 •••