阿里云阿里云智能-数据中心IT运维高级经理-中卫/乌兰察布
任职要求
• 【设施运维】5年及以上数据中心基础设施运维,设计或者相关行业领域经验 • 3年及以上大型数据中心运维管理经验,管理人数超过30人 • 领导自建园区、租用园区设施运维的经验 • 【IT运维】5年及以上数据中心IT服务运维经验; • 3年及以上大型数据中心IT服务运维管理经验,管理人数超过15人; • 领导多个大型数据中心的IT服务运维的经验、熟悉信息技术基础设施领域,包括:服务器、网络技术、布线以及IT服务交付的原则和最佳实践; • 【资产管理】5年及以上数据中心IT资产管理经验,熟悉仓储及供应链管理领域; • 具备1-3年团队管理经验和领导能力,能够管理小型团队并完成相关任务; • 【安全管理】5年及以上大型企业安全和职业健康管理相关经验 • 具备大型生产企业或数据中心安全及职业健康管理经验,支持过电气和暖通系统运营维护相关工作的安全管理者优先 • 精通基础设施领域各主要专业领域的全生命周期管理(例如暖通、电气等) • 持续了解并学习行业内的新技术、新理论、新方法,并能适时应用到所属业务 • 专业领域的问题终结者,具备问题总结和平台建模能力 • 具备业务、技术及运营的全局视角,对日常运维指标、问题、风险进行分析和研究,通过建立模型、计算ROI/TCO来解决、优化和落地 • 能提前发现变更及运维侧的风险点,及时处理突发性故障,为所负责园区的基础设施稳定性负责 • 能够制定园区日常运营流程、规范、标准,推进相应标准的落地 • 持续建立并推广标准化的运维体系和流程,降低运维风险,提升运营效率 • 能够根据业务要求,保证流程执行可控、人员管理到位、供应商配合,Region范围各IDC达成SLA要求的稳定性运营目标 • 负责园区团队的组织文化管理和运维生态团队的管理及考核,带领团队管理所管辖的IDC日常运维、生态员工和供应商的管理工作 • 能够驱动供应商在日常运维过程中提升配合意愿度来达成业务目标 • 单产品研发安全生产执行者 • 能够在单产品/中型复杂系统层面推动建立完善的研发安全生产体系,并推动落地,保障相关产品/技术/系统的可容灾、可观测、可处置、可运维、可快恢 • 熟练掌握业内主流的研发安全生产技术体系 • 具有产品级、中型复杂系统的研发安全生产经验,能够应对比较复杂的项目环境和各类突发状况,保障研发项目的平稳落地 • 具备参与研发安全演练的技术能力,是容灾演练、红蓝对抗、突袭演练等场景下的一线主力 • 对自己负责的研发模块具备快速上线、响应、应急处理能力
工作职责
1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。

根据公司发展规划,进行新FAB工厂数据中心建设和园区综合布线建设(无尘室/非无尘室综合布线/无线对讲等项目) 1.负责IT网络基础设施项目的方案规划及建设,含:无尘室/非无尘室综合布线、无线对讲、手机信号覆盖等项目 2.负责IT数据中心机房项目的方案规划及建设 3.负责现有FAB工厂IT网络基础设施的日常管理及运维,如:IT数据中心机房、FAB园区综合布线、无线对讲系统 4.负责工程项目实施管理,协调项目各方人员,把控项目整体进度、质量、成本 5.定期巡检IT网络基础设施,及时发现潜在问题 6.负责合作伙伴及供应商管理 7.为跨部门及分子公司提供关于IT网络基础设施的技术支持和培训
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。