阿里云阿里云智能-IDC服务运营经理(IM)-南通集群
任职要求
1、教育背景:本科及以上、理工科偏计算机类专业; 2、工作经验:工作年限5年及以上,3年IDC运维主管及以上职位,1年以上经理级管理经验; 3、技能要求:熟悉信息技术基础设施领域,包括:服务器、网络技术、布线以、IT服务交付、资…
工作职责
1、负责辖区内数据中心IT设备(服务器、网络设备)日常运维、服务管理、资产管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务有序高效运营; 2、负责响应和处置阿里IDC风险事件及应急故障处理,实现IDC变更、故障等运行风险可控; 3、承担业务设备的现场技术支持,了解业务需求和网络结构,推动团队间的运营项目实施; 4、负责IDC现场运维团队人才梯队建设、能力培养,风险管控,团队文化建设、现场运维生态团队管理及考核。
1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全; • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内相关岗位的安全生产要求,推动数据中心在环保、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。
1、项目立项和规划 • 【资源运营】基于业务及规划对基础设施资源的供应、变更及退役需求,负责项目立项和规划,实现路径和保障机制设计 • 负责协调项目资源,建立良好的沟通机制,推动核心干系人沟通共识,推动问题上升决策和解决 2、项目全过程管理 • 【资源运营】负责IT项目交付,改造,裁撤等,包括但不限于弱电布线、网络部署、服务器部署、基础设施改造等管理工作 • 【服务运营】负责确定IDC全生命周期的成本基线并监控实际成本,推动专业团队精细运营达成成本目标;梳理IDC团队的业务形态,推动相关团队识别及修复影响IDC业务运营的重大风险 • 负责跟进项目质量、进度、风险、成本等,有效控制风险与进度 •负责管理项目交付团队和现场实施,协调内、外部团队 3、项目管理体系建设 • 持续总结项目实践经验,优化项目管理体系及过程改进措施,识别和确定流程、组织等方面的问题,提供流程、工具、方法等方面的支持,提升项目管理效率和质量。
· Provide technical support for the on-site management of contractors, sub-contractors and vendors, ensuring that all work performed is in accordance with established practices, procedures & local legislation. · Provide technical support for performance benchmarks establishment, conduct analyses, and prepare reports on all aspects of the data center facility infrastructure operations and maintenance. · Generate change management requests & incident management tickets for DCEO activities. · Work with DCO managers (IT) and other business leaders and operating partners to coordinate projects, manage capacity, and optimize plant safety, performance, reliability, sustainability and efficiency. · Establish documentation relevant to technical support of business & facility operations. · Responsible for supporting the installation of the racks and the provision of power/cooling. · Support the COLO management of both routine maintenance and emergency services on a variety of essential systems such as: switchgear, generators, UPS systems, power distribution equipment, chillers, cooling towers, computer room air handlers, building monitoring systems, etc. · Assist in the design, implementation, commissioning and build out of new facilities. · Drive & implement projects to increase current facility capacity, efficiency, sustainability & reliability. · Assist in recruiting efforts. · Support operating partners in the resolution of any infrastructure engineering issues. · This role might involve covering 24x7 shift rotation 岗位职责: • 为承包商、分包商和供应商的现场管理提供技术支持,确保所有工作符合既定流程、程序和当地法律。 • 支持建立执行标准,对数据中心基础设施的运维和维护各个方面进行分析并撰写报告。 • 为数据中心的日常工作创建变更管理请求和事件管理工单。 • 与DCO经理(IT)和其他部门主管以及现场IDC服务运营商合作,协调完成项目,管理站点容量,优化站点安全性,可用性,可靠性,可持续性和效率。 • 撰写,创建与业务和设施运维的技术支持相关的文件。 • 负责支持机柜的安装和机柜供电,供冷。 • 支持COLO(Co-Location,现场提供IDC服务的运营商)的日常常规维护和数据中心基本系统的紧急服务,如:开关柜,柴油发电机,UPS系统,配电设备,冷机,冷塔,精密空调,楼宇监控系统等。 • 协助新数据中心/机房的设计,实施,调试和建设。 • 推动并实施项目,以提高现有设施的产能,效率,可持续性和可靠性。 • 协助招聘工作。 • 支持运维合作伙伴解决运维中遇到技术问题。 • 可能参与轮换倒班以支持24x7的工作需求。
1.战略规划与资源统筹:制定IDC服务策略,确保与公司战略和部门规划一致。平衡服务质量、效率、成本及安全,支撑业务运营; 2.基础设施运维:确保IDC基础设施的整体可靠性、现场运营质量、运营成本及安全,并持续优化及改进。组织管理IDC基础设施的综合运维,保障IDC运营安全;落实IDC的基础设施运维质量指标并承担运维团队的日常管理,组织制订、完善与本部门相关的管理制度; 3.合作伙伴关系管理:与服务商团队建立密切、高效的合作关系。推动服务商建立面向用户的运营体系,提升IDC建设和运营水平; 4.团队管理与考核:管理IDC现场运维外包团队,并进行考核。