logo of papergames

叠纸游戏游戏运维SRE专家

社招全职5年以上平台类地点:上海状态:招聘

任职要求


1、本科及以上学历,5年以上游戏运维工作经验,1年以上团队管理经验。有游戏项目接入经验、熟悉SRE运维体系者优先。
2、拥有使用K8s容器的运维管理经验,有生产实际运维经验。熟悉主流云商产品,如阿里云,腾讯云,aws,游戏架构及常见运维工具。
3、拥有使用PrometheusGrafanaELK、SLS监控工具对系统和应用程序进行故障排除的经验。
4、拥有高级脚本编写经验,熟悉PythonGo等语言及常规框架、模块。
5、出色的沟通、表达和组织能力,拥有较好的自驱力。
6、有责任感,对于工作积极严谨。

工作职责


1、负责游戏项目运维工作,管理游戏运维团队。
2、在阿里云、腾讯云、aws等多云平台上设计、实施和维护高度可用,基于云的基础设施和资源进行服务全生命周期管理。
3、实施和完善CI/CD和基础设施流程,确保服务的无缝部署和管理。
4、完善监控告警系统,能够及时识别和解决服务或安全方面的问题。
5、构建工具和自动化,消除部署中的人工、重复任务,利用基础设施即代码、DevOps工具实现服务的稳定运行。
6、积极致力于维持高标准的系统可用性、性能和安全性,制定和完善运维保障制度、及时响应方案、故障恢复方案等SOP。
7、与开发团队合作,解决线上问题参与工程团队的值班轮换,为游戏服务时间提供升级支持。
包括英文材料
学历+
Kubernetes+
AWS+
Prometheus+
Grafana+
ELK+
脚本+
Python+
Go+
相关职位

logo of bytedance
社招3年以上A236551

1、负责海内外游戏业务的部署,架构设计与实施,确保线上服务的良好运行; 2、负责日常游戏服务器的维护,包括服务器维护、线上环境变更、数据备份、监控及报警处理等; 3、快速响应并处理线上环境故障,识别并解决业务线上相关问题,协助分析与优化服务性能瓶颈; 4、不断完善游戏运维流程工具的效率和使用,如发布变更、监控、报警、日志、追溯、网络优化等; 5、维护游戏的关键SLA指标,确保在效率、成本、质量和安全性方面提供良好的运维支持。

更新于 2024-11-01
logo of 66y
社招5年以上

1.负责公司核心业务系统的各类线上资源维护、监控告警以及应急响应,保障各项服务7*24小时高效稳定运行 2.负责开发和维护自动化运维工具和平台,覆盖部署、监控、日志分析等全生命周期管理 3.负责容量规划、资源调度和混沌工程建设,确保各系统能够应对各类灾难和高并发流量 4.负责系统安全策略的实施与优化,构建零信任安全架构,确保操作审计高覆盖率 5.负责与开发团队紧密协作,推动DevOps文化和SRE理念,做好流程和规范建设,提升开发与运维的协作效率

更新于 2025-02-24
logo of changyou
实习

1、协助完成业务的部署、配置、监控等日常运维工作,保障系统稳定运行; 2、参与线上业务版本发布、故障响应与基础问题排查; 3、在指导下参与运维流程的优化与自动化脚本/工具的初步开发; 4、协助维护持续集成、监控、日志等基础设施; 5、参与游戏服务架构的辅助性工作和文档整理,学习提升服务可靠性及安全性; 6、与开发团队协作,参与持续集成和持续部署(CI/CD)流程的实践与优化; 7、在团队指导下编写和维护部分运维文档与流程说明。

更新于 2025-09-28
logo of netease
社招网易游戏(互娱)

运维研发工程师(SRE)是指用软件工程的方法来管理系统、解决问题并实现运维自动化,以减少琐事,提高服务的可用性。 包括但不限于如下工作内容: 1. 负责网易互娱业务的运维工作,如蛋仔派对、第五人格、UU加速器、一梦江湖、王牌竞速等在线业务,以及公司内部在研项目。; 2. 根据不同游戏的服务架构、性能需求以及业务情况,为游戏服务端设计选用基础运行环境(包括服务器、虚拟化、云服务、网络、数据库等),为游戏提供可控成本下高质、高效的运维服务; 3. 建立与监控各类运维指标,定制数据分析标准; 4. 联合产品部门,根据游戏和基础环境情况及时发现问题、优化技术架构,提升用户体验; 5. 参与前沿开源软件、虚拟化、数据库、WEB服务的深入研究,结合业务落地技术方案。

更新于 2025-05-21