网易高级SRE工程师
社招全职3-5年网易游戏(互娱)地点:广州状态:招聘
任职要求
1. 学历要求:本科及以上学历,计算机、软件工程、信息安全等相关专业优先。 2. 技术能力: * 熟练掌握Linux操作系统及常用命令,具备扎实的系统与网络基础。 * 熟悉SVN、Git、GitLab等版本管理工具的使用和日常维护,有Perforce(P4)实际使用经验者优先考虑。 * 熟悉Jenkins、GitLab CI、或者其他主流CI/CD工具,具备DevOps体系实践经验。 * 有Kubernetes等容器化平台的实际部署和运维经验。 * 至少掌握Shell、Python、Go等脚本或编程语言中的一种,具备自动化运维开发能力。 * 具有Golang、C语言开发经验者优先,有良好的代码规范和开发文档书写能力。 3. 加分项: * 有Perforce(P4)版本管理工具的维护或开发经验。 * 有Golang、C语言实际开发经验。 * 了解主流监控告警系统(如Prometheus、ELK、Zabbix等)并有相关实践。 * 具备安全加固、权限管理和合规运维经验。 4. 能力素质: * 具备良好的沟通与团队协作能力,能够主动推动跨部门协作。 * 工作认真踏实,责任心强,具备良好的自我驱动力和学习能力。 * 具备较强的问题分析和解决能力,能够快速响应并处理突发事件。
工作职责
1. 负责GitLab、SVN、Perforce等版本管理工具的日常维护,参与相关工具的二次开发和定制化功能开发。 2. 负责持续集成(CI)、持续交付(CD)流水线的设计、优化和自动化管理,推动DevOps最佳实践落地。 3. 参与并推动公司各类开发、测试工具链的集成与自动化流程建设,提升研发效率和交付质量。 4. 参与应用日志采集、监控与报警系统的搭建、维护和优化,保障系统稳定性与安全性。 5. 协助开发团队解决代码管理、分支合并、冲突解决等相关问题,提升团队协作效率。 6. 编写和维护相关技术文档,制定运维和开发流程规范,协助团队成员培训与技术支持。 7. 关注并评估业界新技术,推动运维体系的持续改进和创新。
包括英文材料
学历+
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
Git+
https://www.youtube.com/watch?v=rH3zE7VlIMs
Learn Git from start to finished in this full course written by ThePrimeagen.
GitLab+
https://docs.gitlab.com/tutorials/
Learn about GitLab fundamentals by following guided instructions.
Jenkins+
https://www.youtube.com/watch?v=f4idgaq2VqA
CI+
https://www.ibm.com/cn-zh/think/topics/continuous-integration
持续集成 (CI) 是一种软件开发实践,开发人员在整个开发周期中会定期将新的代码和代码变更集成到中央代码存储库中。它是 DevOps 和敏捷方法的关键组成部分。
https://www.youtube.com/watch?v=42UP1fxi2SY
CD+
https://www.redhat.com/zh-cn/topics/devops/what-is-ci-cd
CI/CD 是持续集成和持续交付/部署的缩写,旨在简化并加快软件开发生命周期。
https://www.youtube.com/watch?v=R8_veQiYBjI&list=PLy7NrYWoggjzSIlwxeBbcgfAdYoxCIrM2
DevOps+
https://roadmap.sh/devops
Step by step guide for DevOps, SRE or any other Operations Role in 2025
https://zhuanlan.zhihu.com/p/562036793
DevOps中的Dev指的是Development(开发),Ops指的是Operations(运维),用一句话来说,DevOps就是打通开发运维的壁垒,实现开发运维一体化。
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
Bash+
[英文] The Bash Guide
https://guide.bash.academy/
A quality-driven guide through the shell's many features.
https://www.youtube.com/watch?v=tK9Oc6AEnR4
Understanding how to use bash scripting will enhance your productivity by automating tasks, streamlining processes, and making your workflow more efficient.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
脚本+
[英文] Scripting language
https://en.wikipedia.org/wiki/Scripting_language
https://zhuanlan.zhihu.com/p/571097954
一个脚本通常是解释执行而非编译。脚本语言通常都有简单、易学、易用的特性,目的就是希望能让程序员快速完成程序的编写工作。
Prometheus+
https://grafana.com/docs/grafana/latest/getting-started/get-started-grafana-prometheus/
Prometheus is an open source monitoring system for which Grafana provides out-of-the-box support.
https://prometheus.io/docs/tutorials/getting_started/
Prometheus is a system monitoring and alerting system.
Subversion+
[英文] High-Speed Tutorial
https://svnbook.red-bean.com/en/1.7/svn.intro.quickstart.html
What follows is a quick tutorial that walks you through some basic Subversion configuration and operation.
[英文] SVN Tutorial
https://www.tutorialspoint.com/svn/index.htm
Apache Subversion which is often abbreviated as SVN, is a software versioning and revision control system distributed under an open source license.
https://www.youtube.com/watch?v=dlTkChwvyg4&list=PLS9G7A6kaaHO8kgihFwcAQt5sGRhw8Nwo
Learn Subversion (SVN) Version Control - Introduction to SVN.
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
ELK+
https://logz.io/learn/complete-guide-elk-stack/
With millions of downloads for its various components since first being introduced, the ELK Stack is the world’s most popular log management platform.
https://www.baeldung.com/ops/elk
In this tutorial, we’ll learn about the basics of the ELK stack.
https://www.youtube.com/watch?v=jk4RoEYCZTo
explains how to install and configure ELK (Elastic Search, Logstash, Kibana) Stack, a log management solution for analyzing and visualizing your data.
相关职位
社招5年以上核心本地商业-基
系统可靠性设计与实施:设计和实施可靠、可扩展和高性能的系统架构,确保全球用户的无缝体验。 故障排除与应急响应:主导重大故障的指挥,组织各方有序处理,制定并实施应急预案,确保快速响应和问题解决。 跨团队协作:与开发、产品和运营团队紧密合作,持续提升交付效率和质量。 容量规划:进行容量规划和管理,优化资源利用率,降低成本。 国际化部署方案支持:规划和实施全球化的部署方案,确保各地区的系统一致性和高效运行。针对不同地域的网络环境和法规要求,优化系统架构和数据传输策略。
更新于 2025-06-10
社招2-8年SOFTWARE
1.负责公司MySQL、Redis、MongoDB、PostgreSQL等数据库运维工作,保证系统7*24小时稳定运行 2.负责公司业务线数据库稳定高效运行,协助业务解决潜在的数据库风险,保障SLA达成 3.数据库架构设计:负责公司数据库高可用(HA)及容灾、读写分离、分库分表、分布式数据库等架构设计,确保系统稳定性和可扩展性 4.数据安全:实施数据库权限管理、审计、加密、防注入、备份恢复等安全策略,确保数据安全合规 5.性能优化:监控并优化SQL查询、索引、存储引擎配置,解决慢查询、死锁、高负载等问题,提升数据库响应速度 6.自动化运维:运用DevOPS/AIOPS技术提升运维效率,不断提升数据库运维工程化水平 7.新技术研究:跟踪云数据领域关键核心技术及行业动态,推动数据库架构升级
更新于 2025-07-28
社招5年以上TPG
-负责业务稳定性建设和可用性保障 -负责分布式平台性能和架构优化 -负责设计和实现运维自动化相关系统或工具 -负责业务架构向容器化迁移,提升业务变更和故障自愈能力 -研究与产品发展匹配的运维技术,不断提升资源和交付效率
更新于 2025-05-08