阿里云阿里云智能-产品专家-基础设施运营平台-杭州
任职要求
● 计算机科学或相关领域的背景,具有全球视野与深邃思考。
● 拥有3年以上产品经验,具备云计算、大数据、AI技术的深度理解。
● 具备云基础设施(包括但不限于IDC,服务器等)经验的优先
● 对AI的未来有深刻的洞察与不懈追求,愿意成为推动全球变革的一部分。
● 洞察用户体验痛点,清晰定义问题,结合行业、技术与业务的发展趋势,挖掘产品的优化空间,主导产品设计及持续迭代。
● 良好的项目管理和沟通能力,拉通、推动多个团队协同合作,保证产品规划与需求按期上线,保证业务目标实现。
工作职责
● 负责阿里云基础设施平台的产品设计,设计实现阿里云供应链、IDC、服务器的运维运营系统平台,保障阿里云基础设施的高效稳定安全。 1. 产品需求分析 ● 通过调研和用户沟通,洞察用户场景和需求,挖掘用户价值和痛点。灵活整合内外部资源与反馈,创造突破性产品体验。 ● 根据业务需求和技术可行性,制定长期的产品路线图,并协调内部团队资源进行优先级排序。 2. 产品规划和设计 ● 根据业务流程,按照产品整体规划,制定本业务域的产品规划和迭代演进方案。 ● 根据业务方需求,负责业务模式的沉淀和产品功能模块、能力、界面、交互流程等设计。 3. 产品落地和改进 ● 关注用户对产品的使用,合理安排产品需求优先级,推动产品改进、新产品或功能孵化,提升产品易用性,优化产品稳定性、安全性、性能和成本。 ● 探索并实现生成式AI在全球多元化业务场景中的实际应用,成为AI产品战略的设计者和推动者。
1. 负责基础设施管理平台的产品设计工作; 2. 负责接收用户或业务需求,将其转义成平台功能、设计产品原型并驱动完成研发工作; 3. 负责基础设施算力等资源的定价,并将其运用于公司级的成本管理; 4. 负责对用户体验、成本收益等数据进行分析,引导产品架构设计;
数据中心运营平台团队的使命是实现服务器、IDC等基础设施整个运营领域的全面产品化支撑,从而达到高效率,低成本,低功耗的智能运维。集成了服务器和IDC领域的各项专业技术,以及运维平台进一步的智能化支持,我们立志打造一个真正自动驾驶的数据中心。 作为服务器领域开发专家,您将负责: 1. 负责服务器采集监控机制的定义与优化,包括定义采集的数据,频率以及后续业务应用方式。 2. 负责服务器性能、功耗等数据的分析与应用,提取业务特征,分析业务瓶颈并优化。 3. 基于ARM/X86架构,以及各类AI等异构架构的场景,完善监控与运维手段。 4. 基于故障宕机等场景,从集群角度增强服务器容灾与带故障运行的能力,可用性与稳定性。 5. 基于服务器领域知识与智能化相结合,运用智能化手段管理服务器。 6. 支撑单元化等特殊服务器集群管理场景。
技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、技术架构、数据架构和开发流程 技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 基础服务开发 • 洞察和抽象团队内的共性技术需求并形成基础服务技术方案 • 通过技术框架、技术领域SDK、web组件库、技术知识库等可复用能力的建设,不断提升团队研发效率和质量 技术洞察与研究 • 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的新技术信息,包括但不限于技术原理、技术优劣势、应用场景等 • 追踪并定期分析竞对产品的核心技术指标和发展方向 • 通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察 技术规划 • 基于业务需求和技术洞察,制定技术团队的中长期发展规划和技术路线图 • 体系性的设计各类配套规划,包括技术人员规划、技术基础设施规划、技术质量规划、技术安全规划等 项目管理 • 确定项目目标和范围,并拟定项目计划、预算和资源需求计划、项目风险评估、交付成果等 • 组建项目团队,明确项目各岗位职责和任务,配备必要的资源,并设计高效的协作机制 • 按项目计划进行落地实施,并对项目进度、数据、质量进行监控,确保项目保质保量实施 • 总结项目经验和教训,反馈项目成果和绩效,为之后的项目管理沉淀经验总结
岗位职责: 1、产品研发管理 1.1-主导IoT平台、DCIM(数据中心基础设施管理)系统、安全运营平台、网络监控平台等产品的全生命周期研发,包括需求分析、架构设计、开发实施及上线运维。 1.2-园区IoT PaaS平台建设:主导物联网PaaS平台架构设计与开发,支持IoT感应、网关、空置设备接入,聚焦能耗管理、安防监控(摄像头/门禁/道闸)等场景,实现设备协议标准化、数据采集与实时分析。 1.3-能效管理解决方案:构建园区能耗监测与优化系统,整合电/水/气传感器数据,开发AI能效模型(如LSTM预测、聚类分析),实现能耗异常检测、设备联动控制,目标降低园区综合能耗。 1.4-智能安防与设备集成:主导安防摄像头AI算法(人脸识别、行为分析)、门禁道闸联动控制模块研发,支持第三方设备(海康/大华等)协议对接(ONVIF/GB28181),提升园区安全管理效率。 1.5-数据治理体系搭建:构建基础保障部门主数据平台(MDM),统一IT服务、数据中心、网络运维等业务域的核心数据标准(如设备资产编码、机房拓扑关系、工单分类体系)。 1.6-数据服务开发:基于主数据提供API服务,支持能耗分析、故障预测、资源调度等场景,开发数据血缘管理、元数据质量监控工具,确保数据一致性。 1.7-数据运营支撑:通过主数据与IoT数据的融合分析,输出运营指标看板(如设备利用率、运维成本分摊),驱动IT服务SLA提升、数据中心CAPEX优化等业务决策。 协调跨部门资源,确保产品研发与IT服务、数据中心运维、网络运维等基础保障部门的日常需求高度契合。 2、技术规划与团队赋能 带领10-15人产品与技术团队(产品/TPM/前端/后端/测试/DevOps),制定技术规范,推动敏捷开发与代码质量管控(Code Review/CI/CD)。 培养团队技术能力,定期组织技术分享,引入AIOps等前沿技术提升产品竞争力。