logo of aliyun

阿里云阿里云智能-数据中心运维管理高级专家-集群运维

社招全职10年以上云智能集团地点:乌兰察布 | 河源 | 中卫 | 张家口 | 南通 | 深圳 | 杭州 | 上海状态:招聘

任职要求


• 【设施运维】8年及以上数据中心或者大型设备厂商基础设施运维或设计经验
•   5年及以上大型数据中心运维或者大型设备厂商管理经验,管理人数超过100人
•   领导城市集群的设施运维的经验
• 【IT运维】8年及以上数据中心IT服务运维\运营管理或相关领域工作经验;
•   领导大型城市集群IT服务运维管理的经验,具备5年及以上团队管理经验,能够领导和管理集群IM同学,指导团队成员完成各项IT服务任务,管理人数超过50人
•   领导城市集群IT服务运维,熟悉信息技术基础设施领域,包括:服务器、网络技术、布线以及IT服务交付的原则和最佳实践
• 【资产管理】8年及以上数据中心IT资产管理经验,供应链管理、运营管理或相关领域工作经验;
•   领导大型城市集群IT资产管理的经验,具备3-5年团队管理经验,能够领导和管理集群资产同学,指导团队成员完成各项资产管理任务;
•   熟悉供应链计划和执行、以及资产管理和仓储管理的最佳实践;
• 【安全管理】8年及以上大型企业安全和职业健康管理相关经验
•   具备大型生产企业或数据中心安全及职业健康管理经验,支持过电气和暖通系统运营维护相关工作的安全管理者优先
• 对所负责IDC业务域的业务、技术发展趋势有足够深入的理解
• 具备业务与运维技术的前瞻突破, 解决领域内将会越发突出的棘手问题,或超前的解决方案被更大范围的采纳和应用
• 通过运维技术创新的落地,持续提升IDC运维以及业务的竞争力(包含稳定性、效率、成本等)
• 具备业务、技术及运营的全局视角,对…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、日常运维
• 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全
• 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。
2、安全合规
• 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。
• 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。
• 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。
3、优化改进
• 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。
• 负责阿里IDC能效优化工作,实现机房高效运行。
• 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。
4、技术支撑
• 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。
• 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。
5、团队管理
• 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。
• 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。
包括英文材料
相关职位

logo of cxmt
社招3年以上信息技术类

1. 智能存储架构设计 主导混合云环境下的SAN/NAS融合架构设计,制定跨品牌存储资源池化方案 设计基于AI的FC SAN网络动态路径优化系统,实现Brocade 720级交换网络智能负载均衡,端到端延迟波动≤0.5ms 2. 生产级存储SLA保障 构建存储健康度数字系统,通过实时IO热力图分析实现存储性能瓶颈提前72小时预警(检测准确率≥98%) 主导多厂商存储固件升级制定零停机滚动升级方案,确保关键业务可用性≥99.999% 3. 灾备韧性体系建设 设计跨地域存储双活(HyperMetro+SRDF同步复制)与CDP持续数据保护混合方案,达成核心系统RPO=0且RTO≤180秒的军工级可靠性标准 建立灾备剧本库,通过模拟全链路故障,验证TB级Oracle RAC集群分钟级恢复能力

更新于 2025-09-19合肥
logo of aliyun
社招5年以上云智能集团

1、负责阿里云海外数据中心运维技术中台的综合管理。 2、负责阿里云海外数据中心稳定性的整体管控,制定并持续优化运维标准流程、管理机制,开展日常运维过程质量分析,实现对数据中心稳定管理的技术、管理覆盖,确保达成稳定性目标。 3、开展数据中心的飞检评价,识别架构、维护、应急、人员、管理等风险,协助海外属地运维团队建立风险应急预案和整改方案,并协同推动风险整改闭环。 4、事件应急响应,通过全面掌握海外机房的架构、风险、运行逻辑等,对海外稳定性应急事件进行响应与技术支撑。

更新于 2025-10-16杭州
logo of meituan
社招7年以上核心本地商业-业

负责 Keeta 数据合规与隐私保护技术体系的顶层设计与持续运营,基于业务不同发展阶段,规划并落地可持续、可扩展的合规架构。 主要工作包括且不限于:全球机房部署与跨境隔离设计、隐私产品功能与流程(Privacy by Design)落地、数据安全加固与防护策略落地、隐私数据中心规划与运维、国际合规认证推进、隐私感知能力建设。

更新于 2025-06-16北京
logo of jd
社招10年以上运维工程师岗

1、负责公司全球网络架构的规划设计、部署实施和维护优化,保障网络的高可用性、高性能和高安全性。 2、负责公司网络整体运营保障,网络安全防护 ,网络性能监控及网络故障处理。 3、负责公司IT预算管理,IT设备的选型,进行公司网络设备、网络架构的标准化修订工作,参与全球供应商的商务谈判,包括全球运营商管理,供应商等商务资质和流程的推进。 4、负责和指导开发自动化运维工具,不断研发与探索运维自动化及各类创新途径,缩短运维响应时间,减低运维成本。 5、赋能公司其他部门,提供网络技术支持和建议,助力业务系统的开发与部署。 6、持续跟踪技术和产业发展趋势,深刻洞察公司业务需求,构建满足业务需求和技术领先的IT基础设施。

更新于 2025-10-10北京