阿里云阿里云智能-CICD基础平台开发专家-杭州
任职要求
1. 计算机科学、软件工程或相关领域专业本科以上学历,至少3年以上CI/CD领域的从业经验,有相关系统方案设计和开发经验; 2. 熟悉持续集成涉及到的工具及核心关键技术,如Gitlab CI、Jenkins、CircleCI、GitHub Actions等,对业界CI/CD发展方向有深层理解; 3. 扎实的计算机基础,精通Java/Python/GoLang等至少一种编程语言,熟悉常用的数据结构和算法; 4. 热爱编程,有强烈的求知欲和较强的学习能力,具备良好的逻辑思维能力和沟通能力; 5. 熟悉Docker容器等虚拟化技术,了解Kubernetes、Helm等容器编排技术; 6. 持有阿里云ACE、ACP等认证,并有熟练使用阿里云产品经验者优先;
工作职责
1. CICD平台开发与建设:负责公司内部CI/CD平台的方案设计、开发和维护,确保平台的高可用性和扩展性;引入和集成新的CI/CD工具和技术,以满足业务需求。 2. 版本控制系统管理:精通Git或其他分布式版本控制系统,制定并实施代码分支策略和合并流程,确保代码库的质量和安全。 3. 团队协作与推动:与其他产品研发团队成员密切合作,确保CI/CD流程的顺畅实施;积极沟通和协调各方资源,推动自动化实践的落地。
1. 负责阿里云容器服务的持续集成、持续测试的编译构建和测试核心工具、框架、平台能力建设,用产品化技术化的工程手段提升容器服务工程交付效率; 2. 负责容器服务产品的故障演练和混沌工程体系建设。结合存量的多层复杂架构和产品演进、业内同类风险经验和国家标准等,进行混沌工程工具平台设计、场景实施,并以故障演练为驱动抓手,组织推进1-5-10的稳定性能力落地; 3. 负责用数据化驱动的方式衡量各个组件当前的质量和稳定性能力,使用数据作为抓手进行推进。
1. 数据产品业务专家经验:深入了解数据库产品产品业务场景,内核架构,核心功能,链路关系(数据库产品/数据同步链路),站在风险视角,具备与产研同学技术层面平等对话能力。 必备技能:在线数据库产品技术,加持技能:离线/实时数据计算存储产品了解(spark/flink/hbase等) 2. 数据产品稳定性风险专家经验:面向数据库产品,基于数据产品业务了解,具备快速抽象存量风险,新增风险能力。 面向风险具备设计事前测试(覆盖功能,性能,稳定性,容灾恢复等),事中变更(变更产品功能充分度评估及验证),事后应急恢复(运维产品快速应急充分度评估及验证)的整体风险管控方案。 3. ownership:作为owner,具备自主定义工作,完成0-1方案建设能力,进度自驱跟进,与产研SRE对话能力。为稳定性工作负责,业务稳定性能力具备拆解工作项,带领其他同学完成质量保障工作能力。 4. 技术能力:能够主导领域/大型项目的整体测试工作,包括测试分析、测试用例落地、测试流程规范、测试进度管理、测试风险发现等。 具备至少一种技术栈能力:Java,Python,SQL。可编写SOP化的自动化测试框架,开发自动化工具/平台,设计复杂场景, 如:极端压力测试,破坏性测试等。熟悉CICD研发流程,保障稳定性基础上,兼顾效率。同时在领域稳定性保障上,具备技术破冰能力。
1. 负责阿里云容器服务产品平台化及底层核心服务能力建设,负责阿里云容器产品的架构设计、开发与运维工作,同时支撑多个垂直领域的企业业务运行; 2. 负责容器服务产品ACK、ACS的建设,能结合容器平台之上复杂多样的业务类型,提出产品能力的优化建议,提升容器服务产品的稳定性与高效性; 3. 负责容器领域前沿技术的探索,对云原生AI和大数据等场景的支持。
1. 研发需求洞察与设计:负责阿里云人工智能平台PAI的需求讨论、架构设计、软件开发、功能测试及部署上线,确保项目从初始阶段到交付的全流程高质量执行; 2. 系统优化:从功能、性能、可用性、易用性等多个维度,结合产品设计、产品设计和解决方案架构及客户反馈,进行系统各模块的持续分析和优化,降低用户使用门槛,提升用户满意度和忠诚度; 3. 技术支持与维护:负责线上环境的运行监控与问题定位,与SRE和售后团队紧密协作,及时为客户提供技术支持,保障平台的稳定运行; 4. 前沿技术开发:紧贴大模型及AIGC等业界趋势,提炼并反馈有价值的用户需求,持续增强和改进平台的功能,保持技术的先进性和市场竞争力。