字节跳动SRE运维工程师-游戏技术
社招全职3年以上A236551地点:深圳状态:招聘
任职要求
1、计算机科学、信息系统或相关领域的本科或以上学历; 2、具有至少3年运维或开发经验,熟练掌握Kubernetes (K8S)或其他容器编排解决方案; 3、对于主流的公有云有项目上手经验,如GCP/AWS/阿里云/火山云等; 4、了解CI/CD到IaC技术栈,具备在安装、部署、资源管理和版本发布方面的实际操作经验; 5、能够根据复杂环境提出可行的解决方案,且能有效协调与各方的沟通以确保方案落地; 6、对所负责的任务有强烈的责任心,对新技术有探索精神,并具备快速学习和执行的能力,拥有游戏行业或平台型互联网产品管理经验者优先。
工作职责
1、负责海内外游戏业务的部署,架构设计与实施,确保线上服务的良好运行; 2、负责日常游戏服务器的维护,包括服务器维护、线上环境变更、数据备份、监控及报警处理等; 3、快速响应并处理线上环境故障,识别并解决业务线上相关问题,协助分析与优化服务性能瓶颈; 4、不断完善游戏运维流程工具的效率和使用,如发布变更、监控、报警、日志、追溯、网络优化等; 5、维护游戏的关键SLA指标,确保在效率、成本、质量和安全性方面提供良好的运维支持。
包括英文材料
学历+
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
AWS+
https://aws.amazon.com/
Amazon Web Services offers reliable, scalable, and inexpensive cloud computing services. Free to join, pay only for what you use.
CI+
https://www.ibm.com/cn-zh/think/topics/continuous-integration
持续集成 (CI) 是一种软件开发实践,开发人员在整个开发周期中会定期将新的代码和代码变更集成到中央代码存储库中。它是 DevOps 和敏捷方法的关键组成部分。
https://www.youtube.com/watch?v=42UP1fxi2SY
CD+
https://www.redhat.com/zh-cn/topics/devops/what-is-ci-cd
CI/CD 是持续集成和持续交付/部署的缩写,旨在简化并加快软件开发生命周期。
https://www.youtube.com/watch?v=R8_veQiYBjI&list=PLy7NrYWoggjzSIlwxeBbcgfAdYoxCIrM2
相关职位
社招3年以上
工作内容: 1、负责游戏业务的技术保障工作,包括但不限于日常变更、容量规划、故障处理、重大活动保障; 2、推动提升游戏业务的可靠性、可扩展性以及性能优化,保障业务SLA; 3、积累SRE最佳实践,为业务架构设计与组件选型提供指导,输出标准技术文档; 4、负责管理和维护基础设施,能够通过自动化提高运维效率;
更新于 2025-07-08
社招网易游戏(互娱)
运维研发工程师(SRE)是指用软件工程的方法来管理系统、解决问题并实现运维自动化,以减少琐事,提高服务的可用性。 包括但不限于如下工作内容: 1. 负责网易互娱业务的运维工作,如蛋仔派对、第五人格、UU加速器、一梦江湖、王牌竞速等在线业务,以及公司内部在研项目。; 2. 根据不同游戏的服务架构、性能需求以及业务情况,为游戏服务端设计选用基础运行环境(包括服务器、虚拟化、云服务、网络、数据库等),为游戏提供可控成本下高质、高效的运维服务; 3. 建立与监控各类运维指标,定制数据分析标准; 4. 联合产品部门,根据游戏和基础环境情况及时发现问题、优化技术架构,提升用户体验; 5. 参与前沿开源软件、虚拟化、数据库、WEB服务的深入研究,结合业务落地技术方案。
更新于 2025-05-21

社招5年以上
1.负责公司核心业务系统的各类线上资源维护、监控告警以及应急响应,保障各项服务7*24小时高效稳定运行 2.负责开发和维护自动化运维工具和平台,覆盖部署、监控、日志分析等全生命周期管理 3.负责容量规划、资源调度和混沌工程建设,确保各系统能够应对各类灾难和高并发流量 4.负责系统安全策略的实施与优化,构建零信任安全架构,确保操作审计高覆盖率 5.负责与开发团队紧密协作,推动DevOps文化和SRE理念,做好流程和规范建设,提升开发与运维的协作效率
更新于 2025-02-24