字节跳动运维/资深运维工程师(容器方向)-国际电商
任职要求
1、计算机或相关技术学科本科及以上学历,熟悉容器社区,对容器资源管理,容器网络,RunC等有深入理解; 2、对资源隔离有了解,对CGroup、Namespace机制有深入了解,熟悉常用的资源隔离手段; 3、深入理解Linux系统,熟悉虚拟化相关技术; 4、有大型容器环境的运维管理以及优化经验; 5、具有强烈的责任心、积极进取的团队精神、较强的综合分析和解决问题的能力。
工作职责
1、面向国际电商业务,基于跨团队/时区/地域的合作机制,提供符合实际业务场景的容器稳定性解决方案; 2、负责国际电商容器服务的稳定性保障; 3、根据业务实际场景,提升容器服务的利用率并保障容器服务的利用率均衡性; 4、探索并推进容器服务离线在线资源快上快下; 5、持续跟进国际电商容器服务优化落地。

1、负责应用系统的日常运维操作、故障排查; 2、负责应用系统的监控体系建设、告警体系建设、稳定性体系建设; 3、负责GPU 应用的容器化编排部署、K8S 集群的部署、维护、优化; 4、负责应用系统的资源使用率优化及成本管控; 5、完成公司交办的其他工作。

职位概述 我们正在寻找充满热情、学习能力强、对云计算和网络安全有浓厚兴趣的应届毕业生加入我们的团队。作为云/云安全运维工程师(应届生),你将从基础开始,在资深工程师的指导下,参与公司云平台(如 AWS, Azure, 阿里云, 腾讯云等)的日常运维、监控、基础架构部署以及初步的安全防护工作。这是一个快速学习和成长的平台,你将接触到业界领先的技术实践,为构建稳定、高效、安全的云环境贡献力量。 核心职责 (应届生培养方向) 1.云平台基础运维: o协助进行云资源(虚拟机、存储、网络、数据库等)的日常监控、状态检查与基础故障排查。 o学习并执行云资源的部署、配置、备份与恢复等基础操作(在指导下)。 o参与云环境成本的基础监控和优化建议。 2.云安全初步实践: o协助监控云平台安全日志和告警,识别潜在的安全风险或异常活动。 o学习和应用基础的安全组/防火墙规则、访问控制策略(IAM/RBAC)配置。 o参与漏洞扫描结果的初步分析和跟踪。 o学习并协助实施基础的安全合规性检查。 3.自动化与效率提升: o学习使用脚本语言(如 Python, Shell)或基础设施即代码工具(如 Terraform, Ansible)进行简单自动化任务的编写与执行。 o参与运维流程文档的编写和维护。 4.协作与学习: o积极向导师和团队成员学习,快速掌握云平台和云安全的核心知识与运维技能。 o参与团队的技术分享与讨论,提出改进建议。 o响应内部用户的基础技术支持请求。
1、参与公司基础架构的安全建设,完善安全纵深防御体系,以及相关安全项目管理和推进; 2、应对传统生产环境、公有云、私有云、混合云等复杂网络环境,设计和推进合理的安全防护方案; 3、为软件、系统安全基线、供应链、边界风险、运维部署等基础设施安全; 4、负责服务器及核心系统等系统安全策略的制定、实施、安全审计、持续改进; 5、跟进业界安全能力的前沿趋势,调优公司相应的防御水位。
字节跳动基础架构 SRE 团队负责支持公司各项业务的正常运转,包括处理紧急故障响应、保障业务连续性、产品可用性改进、性能&效率优化、变更管理、监控、容量规划、运维产品开发与管理等相关工作。SRE 前端团队与 SRE 业务团队密切配合,负责搭建基础架构SRE 统一的运维管理平台,以建设通用能力的方式支持各产品(技术组件)搭建理念一致、功能易用的运维分站,实现不同业务场景下的运维闭环。 1、参与应用开发管理、流程引擎、逻辑编排、UI 编排等方向的技术架构和研发; 2、负责搭建物料库、制定各类研发规范,构建统一、高效的前端研发流程; 3、参与公司运维工作的白屏化,自动化和智能化实践,为公司内部提供拥有极致体验的运维产品; 4、深度参与面向未来的下一代基础架构,构建云原生运维产品,为多种业务场景赋能。