阿里云阿里云智能-容器服务工程质量效能技术专家-杭州
任职要求
1. 技术基础扎实:精通Go/Python/Java至少一种编程语言,具备Gin/Spring等主流框架实践经验; 2. 质量专业能力:深入掌握软件测试理论与方法,具备丰富的工程化实践经验及质量效能运营经验; 3. 云原生技术栈:熟悉Kubernetes、Docker等容器化技术,有Tekton/Argo CD等流水线引擎使用经验者优先; 4. AI工程应用:熟悉AI Agent及AI编码助手,…
工作职责
1. CI/CD平台建设:负责构建高效、易用的持续集成平台,支撑团队月均十万次的构建、集成及测试任务执行; 2. 质量体系构建:通过技术创新和工程能力建设,全面提升产品质量,涵盖研发流程优化、测试策略制定、缺陷深度分析及智能诊断等核心环节; 3. 测试效能提升:设计并开发通用测试框架与脚手架工具,推动测试基础设施和测试代码架构升级,提升测试用例的易用性和一致性,显著改善产品测试效率和迭代速度; 4. 混沌工程实践:基于故障复盘与演练机制,持续推进产品容灾能力提升,不断完善混沌工程体系建设,全面覆盖核心容灾场景。

1. 负责无影云管控版本迭代的质量保证工作,覆盖以下:资源管控与调度、用户与权限管理、计量计费、运维管控与安全合规等核心质量域; 2. 主导云管控的测试架构设计与可测试性评审,重点关注接口契约的可测试性、分布式场景的可验证性、配置变更的影响面评估,推动质量左移,在需求评审、架构设计阶段前置质量与体验介入,降低缺陷向后传递成本;建立云管控质量门禁与版本发布准出标准,持续管控缺陷逃逸率;制定测试计划并组织测试方案与结果评审,保障产品高质量、高体验版本持续交付; 3. 探索AI Native测试新范式,将AI能力融入到日常测试中,持续提升测试效能与覆盖率; 4. 构建云管控平台自动化测试体系,推动自动化测试能力与 CI/CD 流水线深度集成,实现代码变更的自动化质量卡点,阻断问题流向生产环境;推动测试能力服务化,赋能开发与业务团队自助质量验证; 5. 建立云管控平台全维度质量度量体系,持续追踪驱动质量问题根因分析与持续改进闭环。
随着通用人工智能技术的快速发展,GPU算力的需求持续飙升,加入阿里云人工智能平台,您将有机会运用卓越工程理念并实践,构建支撑智算中心的工程底座,为AI智算平台的稳定运行保驾护航: 1. 基于先进的云原生技术和devops理念,系统化分析、设计和解决阿里云PAI团队研发过程中的效率质量问题。 2. CI/CD:基于效能领域先进的GitOps理念,建设一流的CI/CD平台,提升研发体验和效率;沉淀易用、高效、可复用的平台工具,整体提升云产品持续交付的效率。 3. 测试环境维护:使用k8s/docker/golang等云原生技术,建设稳定、高效、易维护的多架构容器化测试环境,提升测试效率。 4. 异常巡检能力:搭建自动化巡检、异常检测与告警联动系统,对预发和线上环境的训练任务、推理服务、平台组件异常进行持续健康监测。

1. 技术战略与架构设计 * 负责物流配送核心系统(TMS相关)的技术规划、架构设计与演进,确保系统高可用、高扩展、高性能,支撑业务稳定运行。 * 主导复杂业务场景下的系统设计,包括路径规划、运力调度、实时轨迹追踪、异常预警等核心模块,解决高并发、分布式事务、数据一致性等技术难点。 * 推动系统架构持续优化,结合物流行业特性(如时效性、动态调度)设计技术方案,支持业务快速迭代与规模化扩展。 2. 团队管理与技术赋能 * 负责15人左右Java技术团队的管理,包括目标制定、任务拆解、人才培养及团队效能提升。 * 建立技术规范与研发流程,推动代码质量、自动化测试、DevOps等工程体系建设,提升团队交付效率。 * 关注团队技术成长,主导关键技术攻关,培养核心骨干成员。 3. 业务协同与创新 * 深入理解物流配送业务需求(如即时配送、城配、干线运输等场景),与产品、算法、运维等部门紧密协作,提供高效技术解决方案。 * 探索大数据、AI调度、IoT等技术与配送系统的结合,推动业务创新与效率提升。 4. 跨部门协作与资源统筹 * 协调上下游系统(如WMS、OMS、结算系统等)的技术对接,确保端到端流程顺畅。 * 主导重大项目落地,把控技术风险,保障系统稳定性与交付质量。