logo of netease

网易高级SRE工程师

社招全职3-5年网易游戏(互娱)地点:广州状态:招聘

任职要求


1. 学历要求:本科及以上学历,计算机、软件工程、信息安全等相关专业优先。
2. 技术能力:
  * 熟练掌握Linux操作系统及常用命令,具备扎实的系统与网络基础。
  * 熟悉SVNGitGitLab等版本管理工具的使用和日常维护,有Perforce(P4)实际使用经验者优先考虑。
  * 熟悉JenkinsGitLab CI、或者其他主流CI/CD工具,具备DevOps体系实践经验。
  * 有Kubernetes等容器化平台的实际部署和运维经验。
  * 至少掌握ShellPythonGo脚本或编程语言中的一种,具备自动化运维开发能力。
  * 具有GolangC语言开发经验者优先,有良好的代码规范和开发文档书写能力。
3. 加分项:
  * 有Perforce(P4)版本管理工具的维护或开发经验。
  * 有GolangC语言实际开发经验。
  * 了解主流监控告警系统(如PrometheusELK、Zabbix等)并有相关实践。
  * 具备安全加固、权限管理和合规运维经验。
4. 能力素质:
  * 具备良好的沟通与团队协作能力,能够主动推动跨部门协作。
  * 工作认真踏实,责任心强,具备良好的自我驱动力和学习能力。
  * 具备较强的问题分析和解决能力,能够快速响应并处理突发事件。

工作职责


1. 负责GitLab、SVN、Perforce等版本管理工具的日常维护,参与相关工具的二次开发和定制化功能开发。
2. 负责持续集成(CI)、持续交付(CD)流水线的设计、优化和自动化管理,推动DevOps最佳实践落地。
3. 参与并推动公司各类开发、测试工具链的集成与自动化流程建设,提升研发效率和交付质量。
4. 参与应用日志采集、监控与报警系统的搭建、维护和优化,保障系统稳定性与安全性。
5. 协助开发团队解决代码管理、分支合并、冲突解决等相关问题,提升团队协作效率。
6. 编写和维护相关技术文档,制定运维和开发流程规范,协助团队成员培训与技术支持。
7. 关注并评估业界新技术,推动运维体系的持续改进和创新。
包括英文材料
学历+
Linux+
Git+
GitLab+
Jenkins+
CI+
CD+
DevOps+
Kubernetes+
Bash+
Python+
Go+
脚本+
Prometheus+
Subversion+
C+
ELK+
相关职位

logo of meituan
社招5年以上核心本地商业-基

系统可靠性设计与实施:设计和实施可靠、可扩展和高性能的系统架构,确保全球用户的无缝体验。 故障排除与应急响应:主导重大故障的指挥,组织各方有序处理,制定并实施应急预案,确保快速响应和问题解决。 跨团队协作:与开发、产品和运营团队紧密合作,持续提升交付效率和质量。 容量规划:进行容量规划和管理,优化资源利用率,降低成本。 国际化部署方案支持:规划和实施全球化的部署方案,确保各地区的系统一致性和高效运行。针对不同地域的网络环境和法规要求,优化系统架构和数据传输策略。

更新于 2025-06-10
logo of oppo
社招2-8年SOFTWARE

1.负责公司MySQL、Redis、MongoDB、PostgreSQL等数据库运维工作,保证系统7*24小时稳定运行 2.负责公司业务线数据库稳定高效运行,协助业务解决潜在的数据库风险,保障SLA达成 3.数据库架构设计​​:负责公司数据库​​高可用(HA)及容灾、读写分离、分库分表、分布式数据库等架构设计,确保系统稳定性和可扩展性 4.数据安全​​:实施数据库​​权限管理、审计、加密、防注入​​、备份恢复等安全策略,确保数据安全合规 5.性能优化​​:监控并优化SQL查询、索引、存储引擎配置,解决慢查询、死锁、高负载等问题,提升数据库响应速度 6.自动化运维​​:运用DevOPS/AIOPS技术提升运维效率,不断提升数据库运维工程化水平 7.新技术研究​​:跟踪​​云数据领域关键核心技术及行业动态,推动数据库架构升级

更新于 2025-07-28
logo of baidu
社招5年以上TPG

-负责业务稳定性建设和可用性保障 -负责分布式平台性能和架构优化 -负责设计和实现运维自动化相关系统或工具 -负责业务架构向容器化迁移,提升业务变更和故障自愈能力 -研究与产品发展匹配的运维技术,不断提升资源和交付效率

更新于 2025-05-08
logo of liauto
社招智能与信息技术

1. 负责理想汽车AI平台RDMA网络下大规模GPU集群和并行高速存储的运维工作,为业务平台的可用性负责 2. 调查解决大规模GPU集群管理和大规模AI训练情况下遇到的各种系统/稳定性问题,打造自动化,稳定,易于运维的高速网络和超算集群 3. 深入理解业务,推动AI平台在K8S多集群架构、监控平台、日志等方向的云原生架构演进并落地解决方案 4. 持续建设AI平台运维体系、在稳定性建设、故障定位、资源运营等方向,推动运维工作自动化、工程化