阿里云阿里云智能-弹性计算研发流程管理专家-杭州
任职要求
1. 计算机相关专业背景,5年以上项目管理经验,有独立管理大型跨团队项目以及多并发项目的实际操作经验;有主导跨业务线的复杂项目的经历;具备独立项目规划能力,对整个项目的目标、进度和质量进行有效控制,善于寻求资源解决问题。 2. 熟悉软硬件开发的生命周期,熟悉项目管理领域知识,并具有项目全过程管理的能力;熟悉互联网公司项目管理的思路、方法;有较强的需求分析能力和云计算行业的经验背景,能够将复杂的需求分解为研发任务项。 3. 具备一…
工作职责
1. 负责弹性计算团队重要产研项目的管理工作,确保项目目标达成。 2. 根据组织战略目标的要求,组织相关方进行目标拆解和战役规划,推动核心干系人达成共识。优化资源配置,做好长期目标,短期目标和有限资源之间的统筹与平衡。建立战役组织保障机制,做好战役的执行管理,确保组织战略目标的成功实现。 3.从项目筹备、需求分析、项目规划、过程实施、结果验收、产品发布、运维、业务监控等进行全生命周期管理。有效协调干系人并管理期望值,确保项目有序推进,及时发现并跟踪解决项目问题,有效管理项目风险,协调项目资源,保证目标能够按预期实现落地。 4. 在达成项目目标的同时,通过流程机制建设及可量化可观测的分析,结合产研项目过程的全程跟踪, 能够洞察并改善项目所属产研领域过程中的问题和瓶颈,能够给项目/产研领域一号位提供合理的优化建议;从产品和技术竞争力、业务的发展、从客户问题到产研效率问题等多维度,驱动整个团队提升产出效率。 5.通过过程资产库建设、最佳实践沉淀、项目管理能力赋能等提升团队项目管理能力。
产品规划 •负责阿里云ECS实例产品生命周期和发展路线、商业化策略规划,判断产品需求优先级,制定产品路标。 •通过市场分析,洞察市场机会和技术发展趋势、市场容量和竞争格局,定义细分市场。 •通过竞对分析及,识别产品、架构、技术和价格等方面优劣势,制定竞争策略。 •通过调研,洞察用户和客户场景需求,制定产品方案。 产品设计 •理解和抽象客户需求,分析客户场景,负责产品定义、功能和用户体验设计,输出PRD。 •协调研发团队完成产品的开发和测试,完成产品功能上线。 •基于对产品价值和成本的理解,参与价格策略制定和产品定价建议。 产品经营支持 •制定业务拓展策略,制定关键GTM指标,和PdSA共同制定拓展计划,跟踪产品市场表现和竞品情况,通过数据化经营分析提出产品经营改进建议。 •制定生态发展规划,结合产品力、产品优势场景及伙伴能力图谱,为产品设计基于生态的规模化增长及生态各参与者的健康发展策略。 产品上市 •制定产品上架策略,实现产品上架。 •主导产品GTM材料编写,协助PdSA完成赋能、参与产品营销推广。 •标杆建设,负责新产品、新能力的新客户建设,沉淀为可复制材料。 •产品商机挖掘,负责产品的目标市场分析,商机盘点,输出情报。 产品持续改进 •关注客户对产品的使用,合理安排产品需求优先级,推动产品改进、新产品或功能孵化,提升产品易用性,优化产品稳定性、安全性、性能和成本。
业务支撑 • 参与构建阿里云弹性计算(通用计算CPU、异构计算GPU)的资源管理、售卖、资源调度、资源供给服务,构建全球计算力的基础设施,持续提升资源的利用率; • 参与构建阿里云统一的资源调度池化服务,持续提升资源的利用率和资源的交付效率; • 通过数据分析、结合大模型AI等手段,持续推动产品的演进优化,提升资源调度效率; • 持续演进平台和系统模型,提升整体经营平台的技术先进性; 技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果; • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等; 技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等; • 针对关键技术难题和业务模块,能够独立设计良好的系统架构和方案,具备良好的架构设计、性能和可扩展性; • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署; 稳定性和性能优化 • 解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统稳定安全可靠地运行; • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。
1、技术方案设计 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地
1. 针对ECS异常调度“运维决策大脑”,设计多维的异常调度可验证体系,通过融合存储、心跳、网络状态等多路信号,从根本上解决因单一信号误判导致的业务中断风险,确保自动化决策的精准性; 2. 针对ECS海量线上数据和全链路性能问题,设计和开发创新的测试解决方案与平台,建立精准、高效的性能和稳定性度量体系; 3. 面向失败的可验证性设计,验证系统的韧性架构,尤其针对规模性故障(机房、核心系统依赖),推动核心组件的降级、熔断、故障恢复能力,通过故障注入等方式验证系统的鲁棒性; 4. 作为产品线研发安全生产的构建者,负责在多产品/复杂系统层面构建并落地完善的研发安全生产规范和流程,保障系统的可容灾、可观测、可处置、可运维、可快速恢复; 5. 主导跨产品、大型复杂系统的质量保障工作,组织和推动高水准的稳定性演练(如容灾、红蓝对抗),培养团队的研发安全生产意识和专业能力; 6. 对AIOps/SRE及质量保障领域的技术发展趋势有前瞻性判断,负责测试技术预研、技术难点攻关,推动技术变革与创新,为产品线带来显著收益。