阿里云阿里云智能-产品经理-云内可观测
任职要求
一.关键技能经验 1.8年以上IT工作经验,三年以上产品经理工作经验,计算机相关专业本科及以上学历,拥有良好的英文阅读能力; 2.有云计算、DevOps或SRE(Site Reliability Engineering)相关领域产品经验,有前后端开发背景者优先。 3. 有大厂可观测的产品经验,服务过数万小B客户的产品经验优先。 二.专业技能: 1.对可观测性(Observability)有深刻的理解,能够解释其与监控、日志、追踪等技术的关系。熟悉Prometheus、Grafana、ELK Stack、Jaeger、Zipkin等工具,具备处理大规模数据经验者优先; 2.具备良好的数据分析能力,能够熟练使用SQL、Python等工具对可观测性数据进行查询、分析和可视化展示。 3.对大数据、云计算、人工智能、可观测产品等有浓厚兴趣,对新技术、新硬件、新产品模式等有强烈的探索欲望,具备国际化视野,了解全球市场的可观测性趋势和技术发展。 3.逻辑性强,结构化思维和沟通能力出色,表达清晰、简洁明了
工作职责
负责的产品线:负责神农产品的需求分析、产品设计和业务落地。 1、负责神农数据中心产品的需要分析、整体设计、用户体验设计,定义产品的用户链路和功能操作,组织协同UED、前后端研发完成业务落地。 2、能够分析用户的核心需求和用户目标、规划产品的产品架构、版本迭代和风险管理,提出产品的核心设计原则并指导设计。 3、研究市场趋势、竞争对手动态以及客户需求,确定产品的定位、发展方向和功能特性。根据业务需求和技术可行性,制定长期的产品路线图,并协调内部团队资源进行优先级排序。
技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、技术架构、数据架构和开发流程 技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 基础服务开发 • 洞察和抽象团队内的共性技术需求并形成基础服务技术方案 • 通过技术框架、技术领域SDK、web组件库、技术知识库等可复用能力的建设,不断提升团队研发效率和质量 技术洞察与研究 • 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的新技术信息,包括但不限于技术原理、技术优劣势、应用场景等 • 追踪并定期分析竞对产品的核心技术指标和发展方向 • 通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察 技术规划 • 基于业务需求和技术洞察,制定技术团队的中长期发展规划和技术路线图 • 体系性的设计各类配套规划,包括技术人员规划、技术基础设施规划、技术质量规划、技术安全规划等 项目管理 • 确定项目目标和范围,并拟定项目计划、预算和资源需求计划、项目风险评估、交付成果等 • 组建项目团队,明确项目各岗位职责和任务,配备必要的资源,并设计高效的协作机制 • 按项目计划进行落地实施,并对项目进度、数据、质量进行监控,确保项目保质保量实施 • 总结项目经验和教训,反馈项目成果和绩效,为之后的项目管理沉淀经验总结
1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。
1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。