蚂蚁金服蚂蚁集团-测试开发专家-数据库平台-杭州Z
任职要求
1. 3-5 年测试工作经验,有 AI/计算/存储引擎/基础设施质量工作背景,有白盒测试、性能测试、混沌工程测试经验。 2.…
工作职责
1. 数据产品业务专家经验:深入了解数据库产品产品业务场景,内核架构,核心功能,链路关系(数据库产品/数据同步链路),站在风险视角,具备与产研同学技术层面平等对话能力。 必备技能:在线数据库产品技术,加持技能:离线/实时数据计算存储产品了解(spark/flink/hbase等) 2. 数据产品稳定性风险专家经验:面向数据库产品,基于数据产品业务了解,具备快速抽象存量风险,新增风险能力。 面向风险具备设计事前测试(覆盖功能,性能,稳定性,容灾恢复等),事中变更(变更产品功能充分度评估及验证),事后应急恢复(运维产品快速应急充分度评估及验证)的整体风险管控方案。 3. ownership:作为owner,具备自主定义工作,完成0-1方案建设能力,进度自驱跟进,与产研SRE对话能力。为稳定性工作负责,业务稳定性能力具备拆解工作项,带领其他同学完成质量保障工作能力。 4. 技术能力:能够主导领域/大型项目的整体测试工作,包括测试分析、测试用例落地、测试流程规范、测试进度管理、测试风险发现等。 具备至少一种技术栈能力:Java,Python,SQL。可编写SOP化的自动化测试框架,开发自动化工具/平台,设计复杂场景, 如:极端压力测试,破坏性测试等。熟悉CICD研发流程,保障稳定性基础上,兼顾效率。同时在领域稳定性保障上,具备技术破冰能力。
1. 参与大规模分布式存储系统、高性能单机数据存储引擎的架构设计、功能开发、性能优化等; 2. 参与高可靠、高可用 存储系统的设计研发与演进,确保用户数据安全和服务可用性; 3. 为蚂蚁区块链提供高性能、扩展性好、友好的存储服务。

1)关注风控业务需求的逻辑性与开发方案的合理性,并能预估质量风险,保障产品设计的合理性与可测性; 2)影响和推动整个项目团队的质量意识,推进研发效能与研发质量度量体系建设,对关键点进行管控,持续提高各个环节的准入准出质量; 3)对风控系统进行风险评估,识别可能存在的风险点和安全隐患,如数据泄露风险、系统漏洞风险、业务逻辑风险等,并制定相应的风险应对措施和预案; 4)关注行业的最新动态和技术发展趋势,及时了解新的安全威胁和风险类型,提前做好防范措施,保障风控系统的安全性和稳定性。
1. 稳定性体系规划与落地(质量侧): 负责业务线整体生产安全与稳定性保障体系的建设。作为质量侧代表,与 SRE、业务研发团队紧密协同,制定并落地高可用架构标准。 从业务视角出发,定义稳定性衡量标准(SLA/SLO),并推动技术团队达成稳定性指标(如降低故障率、缩短 MTTR)。 2. 红蓝对抗与全链路演练(质量侧): 主导或参与常态化的红蓝对抗演练。负责设计高复杂度的业务故障场景(蓝军视角/导演视角),验证系统的容灾能力和团队的应急响应能力。 协同 SRE 建设故障注入平台,推动“以演代战”,确保应急预案的有效性和自动化执行率。 3. 变更风险管控: 建立严格的变更管控机制(发布红线、灰度策略、回滚机制)。 建设“变更防御”能力,利用自动化手段拦截高风险代码和配置进入生产环境,治理因变更导致的稳定性问题。 4. 线上巡检与业务核对(BCP): 建设分钟级的业务一致性核对系统,确保在系统未报错但业务逻辑异常(如资金损失、数据不一致)时能快速发现。 补齐监控盲区:不仅关注系统监控(CPU/内存等),更要补齐业务监控盲区。