滴滴业务稳定性-Cuenta SRE 骨干(JR20260626001)
社招全职3年以上技术地点:杭州状态:招聘
任职要求
1、3 年以上 SRE / 稳定性 / 运维开发经验,或资深研发工程师转稳定性方向,有大规模在线服务系统的稳定性保障与架构设计经验,对系统稳定性保障有全面深入的理解。 2、扎实的研发功底,至少精通一门主流语言(Go / Java / Python),能做工具化与自动化;扎实的故障定位与应急处置…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、贴身业务、为一条业务线的稳定性负责:深入理解Fintech业务线(如支付业务/Cuenta数字银行 / 现金贷 / 信用卡 / 先买后付/99pay),作为稳定性owner,围绕可用性、连续性与安全目标,挖掘业务风险、沉淀稳定性标杆,对该线 SLA/SLO、MTTD/MTTR 负责。 2、构建主动防御与快速止损能力:建设监控预警、根因定位、链路分析能力,沉淀降级、限流、熔断、一键预案等止损手段,推动从"被动救火"到"主动防御"。 3、变更与发布管控:主导/参与核心变更评审,识别高危变更;负责 P0/P1 发布的方案制定与值守,守住发布质量。 4、7×24 oncall 与应急:参与业务线 oncall 轮转,快速定位止损;主导/参与故障复盘,闭环改进项。 5、核心链路梳理与容灾:摸清关键链路与依赖,识别单点,推动容灾、弹性等架构演进,提升业务可用率。 6、智能运维与提效:结合 AI 与自动化能力提升保障效率,推动监控自愈、智能诊断等能力落地。
包括英文材料
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
还有更多 •••