
巨人网络高级/资深运维工程师
任职要求
1、5年以上Linux运维相关工作经验,熟悉shell、Python; 2、熟悉Redis、Mongo集群维护, 并具备系统(Linux系统、网络、存储)故障排查和解决经验; 3、对游戏业务运维保障有丰富的实践经验,在复杂业务场景下的流程优化和改进、系统…
工作职责
1、负责游戏/应用系统部署搭建、版本更新、系统监控、日常维护和故障应急响应; 2、根据业务重要等级,推动关键业务规避单点问题,并具有高可用、多机房容灾的能力; 3、推动及开发自动化运维、管理平台建设,提升运维工作效率; 4、参与系统架构的可运维性设计,管理完善监控报警平台,提升稳定性保障; 5、负责收集工作中的痛点和不足,总结经验,优化流程,持续提升运维的质量和效率。

1. 负责devops体系设计和主导建设,关注业内devops体系发展,结合业务和运维的当前现状制定合适的演进路线。 2. 负责devops系统的整体架构设计、产品形态定义、核心代码逻辑的编写,引进行业内和社区效能相关的先进工具及技术等。 3. 和业务开发、运维保持良好沟通,密切配合,进行相关的工具链、流程及平台等的建设,并帮助推进运维规范化流程和制度,并通过系统研发落地。 4. 提升团队整体的自动化水平,创建高效的开发人员体验并减少人工干预,涵盖CI/CD,配置管理和数据上线。
1、负责支撑整个部门的产品运维工作,包括Linux操作系统及基础服务如Nginx、Kvm、DNS、DHCP、ES等日常管理和维护; 2、负责排查处理linux下的各类故障告警,进行相关系统调优, 持续完善监控告警体系; 3、参与自动化运维工具和平台开发,提升自动化程度,减少人为操作风险;通过工具和平台将运维能力赋能给外部其他团队,提高整体效率; 4、负责业务产品的服务器系统层架构设计,实施和维护高可用性、高性能系统架构,确保服务稳定性,将可靠性作为系统设计的核心目标 5、与开发、网络等其他团队紧密协作,提供所需系统层面技术支持和解决方案; 6、持续优化运维操作和流程,建立和维护完善的技术文档,构建团队知识库,促进经验共享和知识传承; 7、关注业界前沿技术动态,通过新的运维技术和方法解决线上问题,提升团队运维质量。
1.负责IDC机房的IT日常运维及服务管理工作,确保集团各业务在贵安机房业务连续稳定性,并达成SLA; 2.推动制度、流程在数据中心落地,提升团队效率和质量; 3.负责IT团队管理,包括引入、培训、评估、绩效管理等工作; 4.负责IT现场稳定性管理,识别风险事件并进行分析、改进提高数据中心稳定性,降低误操作事件发生; 5.负责参与数据中心服务器、网络设备部署、上架、布线及硬件资源规划; 6.负责制定流程规范、新设备SOP,并落实培训,提高IT工程师能力;