蚂蚁金服蚂蚁集团-测试开发专家-大数据计算存储-杭州/北京Z
任职要求
1. 3-5 年测试工作经验,有 AI/计算/存储引擎/基础设施质量工作背景,有白盒测试、性能测试、混沌工程测试经验。 2.…
工作职责
● 负责分布式存储引擎的全生命周期测试管理,制定测试计划、风险评估及资源协调,确保测试覆盖功能、性能、稳定性等核心目标 ● 分析并解决分布式存储引擎中的复杂问题,如分布式事务一致性、引擎性能瓶颈、元数据管理及容灾恢复等 ● 设计并主导存储系统(如分布式存储、文件系统、数据库存储等)的稳定性测试框架,提升测试效率与覆盖率 ● 协同质量、SRE、研发、高可用,主导并跟进落地数智域稳定性专项Action落地,识别关键极端风险并产出预防措施 人员要求: ● 6年以上分布式存储测试开发经验,熟悉存储引擎(如Ceph、HBase、RocksDB)的设计与实现 ● 扎实的代码能力,精通Python/Shell/Go/C++中至少一种语言,能够独立开发测试工具、脚本及自动化框架 ● 能够主导大型项目的整体测试工作,包括测试分析、测试用例落地、测试流程规范、测试进度管理、测试风险发现等 ● 良好的沟通与团队协作能力,能够跨部门推动问题解决 ● 具备大规模分布式存储系统(如PB级数据规模)的测试经验
1. 负责蚂蚁 AI 基础设施中推理、后训练、管控面链路、AI 存储等关键基础设施的质量保障工作,面向重点项目中的业务压力与挑战,补位项目不确定模块/组件的质量保障工作。 2. 主导项目全链路质量保障和风险识别工作,搭建质量技术保障体系、制定质量保障规范、推进测试工作执行。与项目中多角色、多合作团队形成积极有效的沟通和互动,驱动问题解决,保障交付质量。 3. 主动创新,通过技术手段解决质量保障工作中的复杂技术问题,提升测试效能、加深质量工作技术积累。
1、技术方案设计 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地
阿里云国际云云迁移架构师与区域团队和产品团队一起,推动国际公共云业务(尤其是公共云7大件)的健康高速发展。阿里云国际云云迁移架构师的主要职责是结合阿里云公共云产品及三方ISV产品形成通用的云迁移解决方案,并于产研一起沉淀Winback竞争对手的迁移工具及最佳实践,与前线业务团队一起攻坚有迁移机会的公共云重点KA客户,直接参与技术决策以及客户交流,加速客户的迁移上量。同时收集和推动公共云产品需求,发展公共云产品生态,了解竞品动态等。