logo of papergames

叠纸游戏游戏运维SRE专家

社招全职5年以上平台类地点:上海状态:招聘

任职要求


1、本科及以上学历,5年以上游戏运维工作经验,1年以上团队管理经验。有游戏项目接入经验、熟悉SRE运维体系者优先。
2、拥有使用K8s容器的运维管理经验,有生产实际运维经验。熟悉主流云商产品,如阿里云,腾讯云,aws,游戏架构及常见运维工具。
3、拥有使用…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责游戏项目运维工作,管理游戏运维团队。
2、在阿里云、腾讯云、aws等多云平台上设计、实施和维护高度可用,基于云的基础设施和资源进行服务全生命周期管理。
3、实施和完善CI/CD和基础设施流程,确保服务的无缝部署和管理。
4、完善监控告警系统,能够及时识别和解决服务或安全方面的问题。
5、构建工具和自动化,消除部署中的人工、重复任务,利用基础设施即代码、DevOps工具实现服务的稳定运行。
6、积极致力于维持高标准的系统可用性、性能和安全性,制定和完善运维保障制度、及时响应方案、故障恢复方案等SOP。
7、与开发团队合作,解决线上问题参与工程团队的值班轮换,为游戏服务时间提供升级支持。
包括英文材料
学历+
Kubernetes+
AWS+
Prometheus+
还有更多 •••
相关职位

logo of bytedance
社招3年以上A236551

1、负责海内外游戏业务的部署,架构设计与实施,确保线上服务的良好运行; 2、负责日常游戏服务器的维护,包括服务器维护、线上环境变更、数据备份、监控及报警处理等; 3、快速响应并处理线上环境故障,识别并解决业务线上相关问题,协助分析与优化服务性能瓶颈; 4、不断完善游戏运维流程工具的效率和使用,如发布变更、监控、报警、日志、追溯、网络优化等; 5、维护游戏的关键SLA指标,确保在效率、成本、质量和安全性方面提供良好的运维支持。

更新于 2024-11-01深圳
logo of 66y
社招5年以上

1.负责公司核心业务系统的各类线上资源维护、监控告警以及应急响应,保障各项服务7*24小时高效稳定运行 2.负责开发和维护自动化运维工具和平台,覆盖部署、监控、日志分析等全生命周期管理 3.负责容量规划、资源调度和混沌工程建设,确保各系统能够应对各类灾难和高并发流量 4.负责系统安全策略的实施与优化,构建零信任安全架构,确保操作审计高覆盖率 5.负责与开发团队紧密协作,推动DevOps文化和SRE理念,做好流程和规范建设,提升开发与运维的协作效率

更新于 2025-02-24北京
logo of tencent
社招蓝鲸技术

1.参与腾讯游戏智能运维方向场景能力建设; 2.参与腾讯游戏SRE智能体建设。

更新于 2025-11-26深圳
logo of lingxi
社招3年以上

1. 负责公司全球加速节点网络的日常监控、维护与故障排查,保障网络高可用性与低延迟; 2. 深入分析用户行为数据与网络流量特征(包括但不限于连接成功率、延迟、丢包率、地域分布、游戏类型偏好等),识别异常流量与潜在风险; 3. 基于流量分析结果,优化路由策略、节点调度算法及QoS策略,提升用户加速体验; 4. 参与CDN/SD-WAN/智能DNS等网络基础设施的部署、调优与自动化运维; 5. 协同研发团队,对新上线游戏或应用进行网络适配测试与性能评估; 6. 编写自动化脚本与工具,提升网络监控、告警响应及数据分析效率; 7. 跟踪国内外主流游戏网络架构变化,及时调整加速策略以应对反作弊、NAT穿透等挑战。

更新于 2026-03-30广州