logo of aliyun

阿里云阿里云智能-数据中心IT运维专家-亚特兰大/森尼韦尔/华盛顿

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


• 5年及以上数据中心IT服务运维经验;
• 3年及以上大型数据中心IT服务运维管理经验,管理人数超过15人;
• 领导多个大型数据中心的IT服务运维的经验、熟悉信息技术基础设施领域,包括:服务器、网络技术、布线以及IT服务交付的原则和最佳实践;
• 能够制定园区日常运营流程、规范、标准,推进相应标准的落地
• 持续建立并推广标准化的运维体系和流程,降低运维风险,提升运营效率
• 能够根据业务要求,保证流程执行可控、人员管理到位、供应商配合,Region范围各IDC达成SLA要求的稳定性运营目标
• 精通IT专业领域的全生命周期管理
• 持续了解并学…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、日常运维
• 负责数据中心日常运维及管理工作,制定数据中心IT运维策略与运维计划,保障IT稳定性,均衡考虑运维质量、效率、成本及安全
• 通过IT数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。
2、安全合规
• 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。
• 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。
• 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。
3、优化改进
• 负责所辖数据中心的IT运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。
• 负责阿里IDC能效优化工作,实现机房高效运行。
• 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。
4、技术支撑
• 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。
• 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。
5、团队管理
• 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。
• 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。
包括英文材料
相关职位

logo of bytedance
社招S3816

1、负责字节跳动中国区线上海量服务器全生命周期运营运维管理和技术服务,面向业务提供和交付业界第一的服务器运营运维服务,促进和保障业务稳定发展;工作职责涵盖新产品运维引入、运维管控等运营适配、线上运营管理、稳定性运营管理、数据中心服务器运维管理、维保维修、运营流程规范和平台系统规划建设等方向; 2、负责服务器新产品引入运营管理和适配体系化建设,包含制定服务器运维标准基线,规划设计、迭代优化新品可维护性、易维护性、稳定性方案,负责新品引入运营风险识别和评估评审、新产品运营运维方案建设适配等; 3、负责线上服务器基础运营服务,规划和建设稳定安全高效的基础运营服务架构和服务能力,包含固件升级、带外管理、开关机、重启、重装、搬迁等服务架构和能力;负责线上服务器整体维保和技术支持服务交付,规划和建设稳定高效的维保和技术支持体系架构和运维能力,建设改配和利旧交付能力,打造稳定可靠低成本的维保和技术支持服务,保障业务连续性和持续发展; 4、负责线上服务器稳定性保障服务,规划和建设稳定性流程规范、平台系统、保障机制和能力,负责现网运营稳定性监控、稳定性风险识别、问题响应处理和保障措施,保障业务稳定健康运行;负责数据中心IT运维服务,数据中心现场IT运营运维管理、园区物理管理和属地公共关系处理等工作,规划和建设标准化运维体系和能力,监控和防范数据中心IT运维风险,全方位保障数据中心稳定健康运行; 5、负责边缘机房物理资源软硬交付、线上网络服务器一体化运维服务,规划和建设边缘运营服务标准和能力,开展供应商及数据中心IT风险管理,协同商务以更优的服务和成本优势支持业务发展; 6、负责运营运维流程规划设计、管理和优化,平台系统方案规划和设计,通过系统化和自动化方案提升运营效率和质量。

更新于 2025-02-13北京
logo of aliyun
社招10年以上云智能集团

1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。

更新于 2025-12-03乌兰察布|河源|中卫
logo of aliyun
社招5年以上云智能集团

1、负责阿里云全球IDC机房内服务器、网络设备、机柜等交付管理,团队管理,指定并持续优化交付标准,流程,提升交付效率。 2、负责服务器、网络设备、机柜项目交付域的生态管理和建立过程管理标准,安全合规、优化改进,构成持续稳定的交付。 3、交付与平台自动化相结合,持续优化交付平台流程,增强交付过程的安全、数字化、自动化能力。 4、负责IT交付(服务器、网络设备、机柜等)交付中机房稳定安全的管控,准入考核机制建设,人员分类分级标准,实现交付过程对在线业务零影响。 5、负责IT交付(服务器、网络设备、机柜等)SLA,分析SLA完成情况,从根本呈现解决问题,确保SLA满足要求。 6、负责IT交付(服务器、网络设备、机柜等)质量,落实质量问题复盘和问题解决。 7、参与设施运维、IT运维管理、资产管理、安全管理等相关工作

更新于 2025-09-23杭州
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云全球IDC机房基础设施运维技术管理,制定并持续优化IDC基础设施运维标准、流程、质量分析模型,提升运维专业化水平,实现对IDC稳定性管理的技术、管理覆盖。 2. 负责阿里云全球IDC运维自控专业线能力建立,协助一线运维团队建立自控专业梯队。 3. 阿里云全球IDC稳定性事件应急响应,支撑一线运维进行自控系统应急故障处理。 4. 主导阿里云全球IDC运维稳定性飞检,识别自控系统架构风险,协助一线运维团队推动风险闭环。 5. 进行IDC自控及数字化技术探索,建立自控专业运维的数字化、自动化、AIOps能力。 6. 整合运维技术优化需求,对接研发、设计等团队完成需求落地;参与IDC自控新技术、新架构升级的评估,输出运维视角的评估建议。

更新于 2025-08-18杭州