字节跳动运维平台架构师/Tech Lead-监控平台稳定性方向
社招全职5年以上A150329地点:杭州状态:招聘
任职要求
1、本科及以上学历,计算机相关专业,并有五年及以上相关领域工作经验; 2、扎实的计算机软件基础,熟悉Linux 操作系统,熟练掌握Go/Python/Java中至少一门程序开发语言; 3、有较好的架构设计、代码开发经验,能够制定可拆解可落地的目标,并能够在技术和产品设计上指导团队内同学; 4、熟悉监控/告警/日志/事件/Trace等全链路观测产品体系,从0到1建设过巡检、告警、诊断、预案、自愈等系统,具备观测产品整体架构设计经验者优先; 5、对数据化、AIOPS 有一定理解和实践经验,有云计算运维平台架构开发经验者优先。
工作职责
1、负责字节跳动基础架构计算/存储/数据库/大数据等产品的统一运维管控平台的架构设计与开发工作,打造业界领先的运维基础设施平台; 2、构建统一的全链路观测体系(Metrics、Log、Event、Trace),持续迭代优化产品体验; 3、构建一体化的风险、告警、异常、故障等健康管理体系,运用技术化的手段(巡检、诊断、预案、自愈)缩短MTTR,保证生产稳定性; 4、构建基础架构组件SLI、SLO、SLA管理以及计算框架,帮助业务梳理核心SLI,提升异常处理效率以及协同能力; 5、持续跟进业界前沿技术方案并结合内场实际情况,探索可观测性产品建设方向并落地应用,持续提升基础设施的稳定性。
包括英文材料
学历+
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
相关职位
社招5年以上A178760
1、负责字节基础架构计算/存储/数据库/大数据等产品的统一运维管控平台的架构设计与开发工作,打造业界领先的运维基础设施平台; 2、构建统一的全链路观测体系(metrics、log、event、trace),持续迭代优化产品体验; 3、构建一体化的风险、告警、异常、故障等健康管理体系,运用技术化的手段(巡检、诊断、预案、自愈)缩短 MTTR,保证生产稳定性; 4、持续跟进业界前沿技术方案并结合字节内场实际情况,探索可观测性产品建设方向并落地应用,持续提升基础设施的稳定性。
更新于 2023-09-21
社招5年以上A131645
1、负责字节基础架构计算/存储/数据库/大数据等产品的统一运维管控平台的架构设计与开发工作,打造业界领先的运维基础设施平台; 2、构建统一的全链路观测体系(metrics、log、event、trace),持续迭代优化产品体验; 3、构建一体化的风险、告警、异常、故障等健康管理体系,运用技术化的手段(巡检、诊断、预案、自愈)缩短 MTTR,保证生产稳定性; 4、持续跟进业界前沿技术方案并结合字节内场实际情况,探索可观测性产品建设方向并落地应用,持续提升基础设施的稳定性。
更新于 2023-09-21
社招5年以上A121675
1、负责字节跳动基础架构部基础组件(计算/存储/数据库/大数据等产品)的统一运维管控平台的架构设计与开发工作,打造业界领先的运维基础设施平台; 2、打造基础组件的全链路 Devops 工具体系建设,支撑业务的版本交付与效能建设; 3、设计并推动运维生态体系的全链路云原生化构建,打造业界领先的云原生 PaaS 平台; 4、构建端到端的资源预算交付体系,涵盖物理机/虚拟机/云资源的全链路交付与运营体系建设; 5、构建私有云/公有云基础设施组件机房全链路自动化交付体系,提升海内外机房基础设施组件的整体交付效率。
更新于 2023-10-23