小米数据库开发专家(DBA)-Oceanbase方向
任职要求
1. 计算机及相关专业,本科及以上学历; 2. 8年以上工作经验,精通C/C++/Python/Golang/Java/Rust语言中的一种,有分布式数据库、分库分表相关经验优先 3. 深入理解MySQL/OceanBase运行机制和架构体系,包括不限于高可用容灾、主从复制、事务日志等技术 4. 有数据库业务系统全链路性能优化相关工作经验,能够从全链路上定位问题/性能瓶颈(网络、CPU、IO、操作系统等) 5.…
工作职责
1. 负责MySQL、OceanBase等数据库的架构设计、可用性保障、性能优化、故障诊断、容量规划与运维支持等工作 2. 针对大促类、海量数据等场景进行业务和技术方案设计和技术保障,针对业务特点设计合理的数据库解决方案 3. 负责业务遇到的关系型、分布式数据库产品技术问题,确保项目技术方案落地,协调跨团队工作,把控风险,保障顺利交付 4. 负责数据库平台规划、容器云等自动化运维平台研发与落地; 5. 对标行业分布式数据库优秀实践,持续优化团队技术能力,打造行业领先的分布式数据库技术体系
高德运维团队主要负责生产环境的运维建设,对服务稳定性和用户体验负责,主要围绕四个方向进行卓有成效的工作:高质高效的支撑高德的应用交付/变更,用技术手段提升并落地运维自动化;提高系统的稳定性指标;推动产品线架构优化。 数据库专家为云数据库产品提供技术专家服务,面向高德所有业务,聚焦业务在使用云数据库产品中的技术问题,持续推动云数据库产品技术先进性建设。 工作内容包括:高德数据库技术服务体系建设,数据库技术疑难问题攻坚,云数据库产品技术演进等。 1. 负责高德的数据库相关运维工作、提高自动化运维水平、故障响应能力、优化资源使用率; 2. 优化线上技术架构,从运维角度参与并推动研发、产品改进架构体系; 3. 参与运维支撑平台的建设,运维相关的新技术的研究,从提升开发效率、降低运维人力成本出发,设计并搭建运维平台; 4. 负责高德数据库产品以及其他相关产品的选型规划、使用、优化、培训指导。
1、负责网易技术支持部数据库团队的日常管理,包括任务分配、团队协作、绩效考核及技术指导。 2、制定团队技术发展计划,组织技术培训和知识分享,提升团队整体技术能力。 3、主导企业级数据库架构的设计、优化与升级,确保高可用性(HA)、容灾方案(如主从复制、集群、异地容灾)及扩展性,能够根据业务需求规划数据库资源(如实例、存储、性能调优),制定长期技术路线图。 4、推动数据库标准化和自动化运维,设计并落地监控告警、备份恢复、自动化部署等流程,主导数据库故障应急响应,快速定位并解决重大问题(如死锁、性能瓶颈、数据损坏)。 5、监督生产环境数据库的稳定性、性能及安全性,确保 SLA(服务等级协议)达标;制定并执行数据库安全策略(如权限管理、数据加密、审计日志),防范数据泄露和非法访问。 6、监控资源使用情况,优化硬件/云资源分配,降低运维成本。 7、跟踪数据库领域新技术(如云原生数据库、分布式数据库、AI 运维工具),评估其适用性并推动落地。
1. 系统运维与稳定性体系建设 a. 负责HBase/Lindorm、OceanBase等分布式数据库/存储系统的部署、监控、高可用设计以及故障应急,保障99.999%+稳定性SLA b. 主导存储集群性能调优、容灾方案设计(如多机房容灾、数据备份恢复、全球多活、全球合规存储等),提升系统的健壮性。 c. 深入分析慢查询、热点等疑难场景,输出系统性优化解决方案,并实现平台化落地。 d. 针对业务场景设计存储选型方案,平衡性能、成本与可维护性。 e. 制定存储产品,组件运维、变更SOP,以及容灾演练机制与应急预案。 f. 推动开发团队落地存储使用最佳实践、以及平台能力的持续演进,降低人为故障风险。 2. 智能化运维体系建设 a. 开发运维工具链(如监控告警、自动扩缩容、巡检等),推动运维效率的持续提升。 b. 持续积累沉淀专家经验与知识库,基于RAG等技术完善智能答疑的能力,并协助完成运维智能体的持续构建与优化。 c. 持续探索AI-Agent在存储运维场景的应用与落地,实现故障的自动定位、诊断以及自愈。 d. 持续跟踪HBase、Lindorm、OceanBase等分布式存储领域的前沿技术,主导关键组件的升级与架构演进。