logo of bytedance

字节跳动云原生稳定性专家/架构师-基础技术

社招全职A98480A地点:北京状态:招聘

任职要求


1、担任过以下一个或者多个工作角色:研发、运维、质量、稳定性、技术风险;
2、容器和K8S技术知识扎实,有K8S实践经验,深入理解K8S的架构和设计;
3、具有丰富稳定性工程经验,对以下一个或者几个有深入理解和实践:SLA体系、高可用架构、监控与可观测性、容量治理、DevOps、变更管控、故障应急等;
4、具备较强的团队沟通与协助能力、目标驱动和执行力,能够驱动实现复杂业务场景下的稳定性工具平台体系、系统的高可用性架构、组织流程和稳定性意识提升等。

加分项:
1、熟悉云基础产品服务架构,对云原生容器平台有丰富的开发/运维/保障经验;
2、有系统的稳定性平台建设或者负责过产品线或业务线整体稳定性保障、稳定性SRE工作经验;
3、有带领虚拟小组或者带团队经验。

工作职责


1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性;
2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性;
3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。
包括英文材料
Kubernetes+
高可用+
DevOps+
相关职位

logo of bytedance
社招A81609

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of bytedance
社招A48924

1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。

更新于 2025-06-10
logo of eleme
社招10年以上技术类-开发

1、负责公司核心系统的架构设计与技术方案制定,主导复杂业务场景下的技术架构演进,推动高可用、高性能、可扩展的技术体系建设; 2、负责横向大项目的推进和落地,如性能优化、体验优化、AI运维提效等,有体系化和前瞻性; 3、深入参与关键系统性能优化工作,结合业务增长趋势,推动架构持续演进,保障系统在高并发、大数据量场景下的稳定运行; 4、推动架构治理体系建设,制定技术架构规范与标准,指导团队进行合理的技术选型与架构设计,且具备跨部分的协同能力; 5、关注行业技术趋势,推动云原生、微服务治理、服务网格、分布式架构等前沿技术在业务场景中的落地实践。

更新于 2025-09-15
logo of bytedance
社招A83532

本团队负责数百万节点的云原生基础设施,支撑公司的所有产品线。目前在 kubernetes 集群管控技术,运行时资源优化,多云多集群,云原生基础设施稳定性保障方面都会比较深入的技术积累,并且开源有 kubebrain, katalyst 等云原生基础技术相关项目,团队持续围绕以资源并池,资源弹性为中心的基础技术研发和突破。 1、构建标准化的容器运行时规范,推动容器架构的演进; 2、根据业务实际场景优化容器运行时,推动RunC,Kata 等MicroVM容器运行时的迭代,提供资源隔离能力,优化应用运行稳定性; 3、和资源优化方向密切协作,在保障数据面稳定性的前提下,提升资源使用效率; 4、推动镜像系统的迭代,设计并推动镜像加速/镜像分发等项目落地; 5、积极探索容器运行时技术形态,参与设计和实现容器数据面卸载,推动容器和容器虚拟化融合等技术的研发和落地。

更新于 2023-12-15