logo of xiaohongshu

小红书高可用架构师-基础技术

社招全职4年以上后端开发地点:上海 | 北京 | 杭州状态:招聘

任职要求


1、全日制统招本科及以上学历,4年及以上计算机相关工作经验,在技术风险领域有经验者优先;
2、对服务治理、混沌工程、可观测性、高可用平台、云原生发布等系统有深刻的理解;
3、有大型复杂系统(搜索、推荐、电商等系统)的工程开发经验,并在其中负责过稳定性保障;
4、熟悉基础技术(如通信、存储、MQ等)开源组件,深入了解细节,掌握实现原理优先;
5、善于发现、解决问题,善于总结、思考、跨团队协作,能吃苦耐劳;
6、关注业界新技术,好奇求知,有强烈的责任心及抗压能力。

工作职责


1、夯实并迭代现有小红书的高可用架构设计(异地多活、多层容灾架构、服务自治等),通过技术发现破坏高可用架构设计的业务,并提供高可用相关平台能力进行高效改进;
2、理解业务架构,运用基础技术体系基建能力,设计面向未来小红书的发展的业务高可用架构,并在公司核心场景实施落地;
3、从稳定性、效率、成本角度,为业务提供专业的高可用架构技术顾问和技术保障支持;
包括英文材料
学历+
服务治理+
高可用+
消息队列+
相关职位

logo of bytedance
社招A81609

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of bytedance
社招A98480A

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of bytedance
社招A48924

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of kuaishou
社招10年以上D7190

快手研发线体系下稳定性治理团队,致力于面向快手所有产研团队提供业界领先的稳定性保障方案,依托业界前沿技术,为快手业务稳定性保驾护航。 1、参与公司整体稳定性规划及推动建设,面向研发体系进行技术风险发现、治理,推动最佳实践的落地,建立对稳定性风险的系统性抵御能力; 2、负责设计、落地稳定性保障解决方案,包括但不局限于:监控治理、变更管控、服务治理、容灾演练、混沌工程,故障管理等; 3、通过数据分析、故障注入等方式驱动,持续识别稳定性薄弱环节,推动公司级的优化专项,提升整体稳定性; 4、设计并实现稳定性度量和风险识别体系,协助公司各个业务完成反脆弱设计。

更新于 2024-07-29