
转转DBA(J13359)
任职要求
1、本科及以上学历,2年左右DBA相关工作经验,有互联网行业数据库运维经验者优先。 2、熟悉MySQL数据库基本原理、集群安装配置、数据迁移、备份恢复、慢查询优化等。 3、熟…
工作职责
1、负责维护数据库服务的稳定性、执行性能优化、故障诊断、容量规划及日常运维工作。 2、负责数据库相关项目的实施和推进,包括开发自动化运维工具以提高效率。
1、设计、梳理和优化现有数据库缓存(redis、memcached)和关系型数据库(MySQL)架构; 2、负责数据库的日常操作、配置、监控、灾难恢复和管理; 3、处理业务数据库运行中出现的问题,保证业务数据安全、可用; 4、制定数据库缓存和关系型数据库设计和开发规范,并定期对业务开发团队进行培训。
工作描述: 负责公司内部数据库的运维管理,包括 MySQL、MongoDB、PostgreSQL等多种数据库的维护和运行。 负责数据库的性能优化,包括 SQL 优化、索引优化、数据库配置优化等。 负责数据库的监控和报警,包括数据库服务器的监控、网络监控、磁盘监控。 参与数据库的架构设计和规划,包括数据库集群的设计、数据库容量规划、数据库服务器的购置和部署等。 协助解决数据库相关的问题和事故,包括数据库崩溃、数据库锁等待、数据库读写失败等。 不定期进行技术研究和技能提升,例如学习新的数据库技术、参加技术会议和研讨会。
1、负责网易技术支持部数据库团队的日常管理,包括任务分配、团队协作、绩效考核及技术指导。 2、制定团队技术发展计划,组织技术培训和知识分享,提升团队整体技术能力。 3、主导企业级数据库架构的设计、优化与升级,确保高可用性(HA)、容灾方案(如主从复制、集群、异地容灾)及扩展性,能够根据业务需求规划数据库资源(如实例、存储、性能调优),制定长期技术路线图。 4、推动数据库标准化和自动化运维,设计并落地监控告警、备份恢复、自动化部署等流程,主导数据库故障应急响应,快速定位并解决重大问题(如死锁、性能瓶颈、数据损坏)。 5、监督生产环境数据库的稳定性、性能及安全性,确保 SLA(服务等级协议)达标;制定并执行数据库安全策略(如权限管理、数据加密、审计日志),防范数据泄露和非法访问。 6、监控资源使用情况,优化硬件/云资源分配,降低运维成本。 7、跟踪数据库领域新技术(如云原生数据库、分布式数据库、AI 运维工具),评估其适用性并推动落地。
1. 系统运维与稳定性体系建设 a. 负责HBase/Lindorm、OceanBase等分布式数据库/存储系统的部署、监控、高可用设计以及故障应急,保障99.999%+稳定性SLA b. 主导存储集群性能调优、容灾方案设计(如多机房容灾、数据备份恢复、全球多活、全球合规存储等),提升系统的健壮性。 c. 深入分析慢查询、热点等疑难场景,输出系统性优化解决方案,并实现平台化落地。 d. 针对业务场景设计存储选型方案,平衡性能、成本与可维护性。 e. 制定存储产品,组件运维、变更SOP,以及容灾演练机制与应急预案。 f. 推动开发团队落地存储使用最佳实践、以及平台能力的持续演进,降低人为故障风险。 2. 智能化运维体系建设 a. 开发运维工具链(如监控告警、自动扩缩容、巡检等),推动运维效率的持续提升。 b. 持续积累沉淀专家经验与知识库,基于RAG等技术完善智能答疑的能力,并协助完成运维智能体的持续构建与优化。 c. 持续探索AI-Agent在存储运维场景的应用与落地,实现故障的自动定位、诊断以及自愈。 d. 持续跟踪HBase、Lindorm、OceanBase等分布式存储领域的前沿技术,主导关键组件的升级与架构演进。