网易数据库运维专家(DBA)
任职要求
1、5 年以上数据库管理经验,2 年以上团队管理或技术领导经验。 2、精通至少一种主流数据库(如 Oracle/MySQL/PostgreSQL/SQL Server),熟悉云数据库(如 AWS RDS、阿里云 PolarDB或Oceanbase等)。 3、深入理解数据库原理(事务、锁机制、存储引擎、备份恢复等)。熟练使用性能分析工具,具备脚本开发能力(如 Shell/Python/Ansible),熟悉自动化运维工具。 4、具备系统性思维,能从架构层面规避风险。 5、良好的沟通协调能力,能激励团队并推动跨部门合作。 6、能在高压环境下冷静处理紧急故障,保障系统稳定。 7、对新技术的敏感度和快速学习能力,适应技术变革。
工作职责
1、负责网易技术支持部数据库团队的日常管理,包括任务分配、团队协作、绩效考核及技术指导。 2、制定团队技术发展计划,组织技术培训和知识分享,提升团队整体技术能力。 3、主导企业级数据库架构的设计、优化与升级,确保高可用性(HA)、容灾方案(如主从复制、集群、异地容灾)及扩展性,能够根据业务需求规划数据库资源(如实例、存储、性能调优),制定长期技术路线图。 4、推动数据库标准化和自动化运维,设计并落地监控告警、备份恢复、自动化部署等流程,主导数据库故障应急响应,快速定位并解决重大问题(如死锁、性能瓶颈、数据损坏)。 5、监督生产环境数据库的稳定性、性能及安全性,确保 SLA(服务等级协议)达标;制定并执行数据库安全策略(如权限管理、数据加密、审计日志),防范数据泄露和非法访问。 6、监控资源使用情况,优化硬件/云资源分配,降低运维成本。 7、跟踪数据库领域新技术(如云原生数据库、分布式数据库、AI 运维工具),评估其适用性并推动落地。
1. 负责数据库的技术架构和团队管理 2. 带领团队高效响应并处理故障/风险,保障业务稳定性 3. 规划和推动数据库的平台化建设 4. 制定、推广、优化数据库运维规范和流程落地 5. 对数据库相关的新技术进行研究、落地
1. 负责数据库的技术架构和团队管理 2. 带领团队高效响应并处理故障/风险,保障业务稳定性 3. 规划和推动数据库的平台化建设 4. 制定、推广、优化数据库运维规范和流程落地 5. 对数据库相关的新技术进行研究、落地
1. 负责MySQL、OceanBase等数据库的架构设计、可用性保障、性能优化、故障诊断、容量规划与运维支持等工作 2. 针对大促类、海量数据等场景进行业务和技术方案设计和技术保障,针对业务特点设计合理的数据库解决方案 3. 负责业务遇到的关系型、分布式数据库产品技术问题,确保项目技术方案落地,协调跨团队工作,把控风险,保障顺利交付 4. 负责数据库平台规划、容器云等自动化运维平台研发与落地; 5. 对标行业分布式数据库优秀实践,持续优化团队技术能力,打造行业领先的分布式数据库技术体系
1. 系统运维与稳定性体系建设 a. 负责HBase/Lindorm、OceanBase等分布式数据库/存储系统的部署、监控、高可用设计以及故障应急,保障99.999%+稳定性SLA b. 主导存储集群性能调优、容灾方案设计(如多机房容灾、数据备份恢复、全球多活、全球合规存储等),提升系统的健壮性。 c. 深入分析慢查询、热点等疑难场景,输出系统性优化解决方案,并实现平台化落地。 d. 针对业务场景设计存储选型方案,平衡性能、成本与可维护性。 e. 制定存储产品,组件运维、变更SOP,以及容灾演练机制与应急预案。 f. 推动开发团队落地存储使用最佳实践、以及平台能力的持续演进,降低人为故障风险。 2. 智能化运维体系建设 a. 开发运维工具链(如监控告警、自动扩缩容、巡检等),推动运维效率的持续提升。 b. 持续积累沉淀专家经验与知识库,基于RAG等技术完善智能答疑的能力,并协助完成运维智能体的持续构建与优化。 c. 持续探索AI-Agent在存储运维场景的应用与落地,实现故障的自动定位、诊断以及自愈。 d. 持续跟踪HBase、Lindorm、OceanBase等分布式存储领域的前沿技术,主导关键组件的升级与架构演进。