logo of bytedance

字节跳动运维稳定性架构师-基础技术

社招全职A117468地点:杭州状态:招聘

任职要求


1、有一定的云计算重要领域的运维架构及开发经验;
2、熟悉Linux内核,有一定的线上问题排障能力;
3、具有优秀的沟通技巧、团队合作经验、敬业精神和学习能力;
4、有云厂商稳定性建设和智能运维系统开发经验者优先。

工作职责


1、负责稳定性运维平台的构建,推动应急协同,风险隐患巡检,监控发现等能力的平台化、智能化;
2、负责稳定性规范和度量的制定,包括但不限于研发质量,变更发布,主机亚健康、宕机治理等方面,并推动相关的稳定性规范在研发侧落地;
3、负责生产环境的应急响应,故障定位,故障快速恢复,并推动上下游相关改进措施的落地。
包括英文材料
Linux+
内核+
相关职位

logo of bytedance
社招A103200

1、负责稳定性运维平台的构建,推动应急协同,风险隐患巡检,监控发现等能力的平台化、智能化; 2、负责稳定性规范和度量的制定,包括但不限于研发质量,变更发布,主机亚健康、宕机治理等方面,并推动相关的稳定性规范在研发侧落地; 3、负责生产环境的应急响应,故障定位,故障快速恢复,并推动上下游相关改进措施的落地。

更新于 2025-06-09
logo of bytedance
社招A81609

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of bytedance
社招A98480A

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of bytedance
社招A48924

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10