字节跳动可靠性架构师 - 火山引擎
社招全职A129755地点:北京状态:招聘
任职要求
1、熟悉云基础产品服务架构,对云计算、云网络、存储、云原生有丰富的实践经验;
2、具有互联网基础设施领域平台设计及落地工作:包括但不限于监控体系、DevOps、运维自动化、故障应急联动…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、分析和识别云产品服务的稳定性与高可用的薄弱点,掘并抽象故障场景,给出解决方案并推进落地与验证; 2、参与系统性梳理核心系统容灾技术方案,推动和参与核心服务的容灾能力建设; 3、组织大规模线上压测、故障演练、预案演习,使系统能有效治理风险和快速故障应急; 4、建设蓝军能力,负责演练验收能力与工具平台建设,数据化驱动系统容灾容错能力的持续优化。
包括英文材料
DevOps+
https://roadmap.sh/devops
Step by step guide for DevOps, SRE or any other Operations Role in 2025
https://zhuanlan.zhihu.com/p/562036793
DevOps中的Dev指的是Development(开发),Ops指的是Operations(运维),用一句话来说,DevOps就是打通开发运维的壁垒,实现开发运维一体化。
面向对象+
https://liaoxuefeng.com/books/java/oop/index.html
面向对象编程,英文是Object-Oriented Programming,简称OOP。
https://liaoxuefeng.com/books/python/oop/index.html
面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。
https://www.youtube.com/watch?v=SiBw7os-_zI
Learn the basics of object-oriented programming all in one video.
还有更多 •••
相关职位
社招5年以上4BY1
1、面向公有云场景,与销售、BD、产品研发等部门紧密协同,跟进行业重点客户,推动标准产品或解决方案在客户侧落地; 2、为字节跳动内外部客户提供业务和技术层面的架构咨询服务,理解合作伙伴及客户的业务和功能性需求、非功能性需求、性能和可靠性需求,提供基于火山引擎产品体系的架构设计方案,支持客户或合作伙伴成功地在火山引擎产品上构建上层应用系统和服务; 3、通过对客户业务的深入理解和分析,提炼客户的终极诉求,结合公司产品和技术能力,沉淀行业细分方向的GTM方法论,树立行业标杆案例和典型场景价值案例。
更新于 2020-11-06上海
社招A81609
1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。
更新于 2025-06-10杭州
社招A98480A
1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。
更新于 2025-06-10北京