logo of itigerup

老虎国际DBA工程师

社招全职3年以上互联网 / 电子 / 网游地点:北京状态:招聘

任职要求


必须项:
- 3 年以上 MySQL 生产环境运维经验,精通 InnoDB 引擎机制(事务、锁、MVCC、日志、Buffer Pool);
- 熟练掌握 MySQL 主从复制、GTID、MHA / Orchestrator / InnoDB Cluster 等高可用方案;
- 能独立完成慢查询分析、执行计划解读、索引优化、参数调优;
- 有 Redis 运维经验,理解持久化、淘汰策略、集群分片、缓存穿透/雪崩应对;
- 熟悉至少一种消息队列KafkaRabbitMQ),了解其架构、运维要点与常见故障;
- 熟练使用 Linux 系统,能排查 IO、内存、网络、进程等系统级问题;
- 熟悉 Shell/Python 至少一种,能编写自动化运维脚本;
- 强烈的问题驱动型人格 —— 看…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


- 负责公司核心 MySQL 集群的部署、监控、备份、扩容、高可用架构设计与日常运维;
- 快速定位并解决线上 MySQL 性能瓶颈、慢查询、锁冲突、主从延迟、复制异常等复杂问题;
- 深度优化 SQL 与索引,参与数据库设计评审,推动开发写出“不炸库”的 SQL;
- 运维 Redis 集群(主从、哨兵、Cluster),保障缓存高可用与数据一致性;
- 熟悉 Kafka / RabbitMQ 等消息中间件,能排查消息积压、消费异常、集群故障等运维问题;
- 编写自动化脚本(Shell/Python/Go),提升数据库部署、巡检、故障自愈效率;
- 参与数据库容量规划、灾备演练、压测方案设计,保障业务 7x24 稳定运行;
- 对线上突发数据库故障能快速响应、冷静处理、复盘改进,形成知识沉淀;
- 保持对数据库新技术的好奇心,主动研究源码、内核机制、性能调优技巧,乐于分享。
 我们希望你:
- 不满足于“重启解决” —— 你渴望知道“为什么”;
- 不止步于“能用就行” —— 你追求“最优解”;
- 不害怕“半夜告警” —— 你享受“手起刀落修复问题”的快感;
- 对数据库有“洁癖” —— 看到烂 SQL 会手痒,看到无索引查询会心痛;
- 是个“技术侦探” —— 从一堆日志里抽丝剥茧,还原故障现场让你兴奋。
 我们提供:
- 与业内顶尖架构师、SRE、开发团队协作的机会;
- 深度参与千万级/亿级用户规模数据库架构演进;
- 鼓励技术钻研、源码阅读、参加行业会议、发表技术文章;
- 有竞争力的薪酬 + 年终奖 + 股权激励(视职级);
- 弹性工作制 + 不鼓励无效加班 + 故障复盘不甩锅文化;
包括英文材料
MySQL+
MVCC+
高可用+
Redis+
缓存+
消息队列+
Kafka+
RabbitMQ+
Linux+
Bash+
还有更多 •••
相关职位

logo of pinduoduo
社招2年以上技术类

1、设计、梳理和优化现有数据库缓存(redis、memcached)和关系型数据库(MySQL)架构; 2、负责数据库的日常操作、配置、监控、灾难恢复和管理; 3、处理业务数据库运行中出现的问题,保证业务数据安全、可用; 4、制定数据库缓存和关系型数据库设计和开发规范,并定期对业务开发团队进行培训。

更新于 2025-04-09上海
logo of shein
社招信息技术类

工作描述: 负责公司内部数据库的运维管理,包括 MySQL、MongoDB、PostgreSQL等多种数据库的维护和运行。 负责数据库的性能优化,包括 SQL 优化、索引优化、数据库配置优化等。 负责数据库的监控和报警,包括数据库服务器的监控、网络监控、磁盘监控。 参与数据库的架构设计和规划,包括数据库集群的设计、数据库容量规划、数据库服务器的购置和部署等。 协助解决数据库相关的问题和事故,包括数据库崩溃、数据库锁等待、数据库读写失败等。 不定期进行技术研究和技能提升,例如学习新的数据库技术、参加技术会议和研讨会。

更新于 2024-05-08南京
logo of netease
社招5年以上网易云音乐

1、负责网易技术支持部数据库团队的日常管理,包括任务分配、团队协作、绩效考核及技术指导。 2、制定团队技术发展计划,组织技术培训和知识分享,提升团队整体技术能力。 3、主导企业级数据库架构的设计、优化与升级,确保高可用性(HA)、容灾方案(如主从复制、集群、异地容灾)及扩展性,能够根据业务需求规划数据库资源(如实例、存储、性能调优),制定长期技术路线图。 4、推动数据库标准化和自动化运维,设计并落地监控告警、备份恢复、自动化部署等流程,主导数据库故障应急响应,快速定位并解决重大问题(如死锁、性能瓶颈、数据损坏)。 5、监督生产环境数据库的稳定性、性能及安全性,确保 SLA(服务等级协议)达标;制定并执行数据库安全策略(如权限管理、数据加密、审计日志),防范数据泄露和非法访问。 6、监控资源使用情况,优化硬件/云资源分配,降低运维成本。 7、跟踪数据库领域新技术(如云原生数据库、分布式数据库、AI 运维工具),评估其适用性并推动落地。

更新于 2025-06-17杭州
logo of antgroup
社招3年以上技术-SRE

1. 系统运维与稳定性体系建设 a. 负责HBase/Lindorm、OceanBase等分布式数据库/存储系统的部署、监控、高可用设计以及故障应急,保障99.999%+稳定性SLA b. 主导存储集群性能调优、容灾方案设计(如多机房容灾、数据备份恢复、全球多活、全球合规存储等),提升系统的健壮性。 c. 深入分析慢查询、热点等疑难场景,输出系统性优化解决方案,并实现平台化落地。 d. 针对业务场景设计存储选型方案,平衡性能、成本与可维护性。 e. 制定存储产品,组件运维、变更SOP,以及容灾演练机制与应急预案。 f. 推动开发团队落地存储使用最佳实践、以及平台能力的持续演进,降低人为故障风险。 2. 智能化运维体系建设 a. 开发运维工具链(如监控告警、自动扩缩容、巡检等),推动运维效率的持续提升。 b. 持续积累沉淀专家经验与知识库,基于RAG等技术完善智能答疑的能力,并协助完成运维智能体的持续构建与优化。 c. 持续探索AI-Agent在存储运维场景的应用与落地,实现故障的自动定位、诊断以及自愈。 d. 持续跟踪HBase、Lindorm、OceanBase等分布式存储领域的前沿技术,主导关键组件的升级与架构演进。

更新于 2025-05-15成都