阿里云阿里云智能-数据中心IT运维高级经理-中卫/乌兰察布
任职要求
• 【设施运维】5年及以上数据中心基础设施运维,设计或者相关行业领域经验 • 3年及以上大型数据中心运维管理经验,管理人数超过30人 • 领导自建园区、租用园区设施运维的经验 • 【IT运维】5年及以上数据中心IT服务运维经验; • 3年及以上大型数据中心IT服务运维管理经验,管理人数超过15人; • 领导多个大型数据中心的IT服务运维的经验、熟悉信息技术基础设施领域,包括:服务器、网络技术、布线以及IT服务交付的原则和最佳实践; • 【资产管理】5年及以上数据中心IT资产管理经验,熟悉仓储及供应链管理领域; • 具备1-3年团队管理经验和领导能力,能够管理小型团队并完成相关任务; • 【安全管理】5年及以上大型企业安全和职业健康管理相关经验 • 具备大型生产企业或数据中心安全及职业健康管理经验,支持过电气和暖通系统运营维护相关工作的安全管理者优先 • 精通基础设施领域各主要专业领域的全生命周期管理(例如暖通、电气等) • 持续了解并学习行业内的新技术、新理论、新方法,并能适时应用到所属业务 • 专业领域的问题终结者,具备问题总结和平台建模能力 • 具备业务、技术及运营的全局视角,对日常运维指标、问题、风险进行分析和研…
工作职责
1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。

根据公司发展规划,进行新FAB工厂数据中心建设和园区综合布线建设(无尘室/非无尘室综合布线/无线对讲等项目) 1.负责IT网络基础设施项目的方案规划及建设,含:无尘室/非无尘室综合布线、无线对讲、手机信号覆盖等项目 2.负责IT数据中心机房项目的方案规划及建设 3.负责现有FAB工厂IT网络基础设施的日常管理及运维,如:IT数据中心机房、FAB园区综合布线、无线对讲系统 4.负责工程项目实施管理,协调项目各方人员,把控项目整体进度、质量、成本 5.定期巡检IT网络基础设施,及时发现潜在问题 6.负责合作伙伴及供应商管理 7.为跨部门及分子公司提供关于IT网络基础设施的技术支持和培训
1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。
特斯拉正在寻找一位富有激情和丰富经验的数据中心工程师加入我们的IT基础设施及运营团队,负责数据中心基础设施,理想的候选人具备丰富的设计,建造以及维护数据中心基础设施的能力,包括但不限于计算机、通信、流程管理,电力,暖通和智能化等领域的专业知识,候选人将会帮助我们建造下一代数据中心来保障我们的IT基础设施99.99%可用。 岗位职责 负责数据中心业务连续稳定、制定并达成SLA、参与新数据中心的建设、现有数据中心的扩展以及包括计算、存储、网络和其他基础设施组件在内的部署; 负责参与数据中心服务器,网络设备部署、资产管理、上架、布线及硬件资源规划; 负责服务器硬件(CPU、内存、硬盘、RAID卡、网卡、电源等)的安装、调试、维护及故障排查; 负责制定流程规范、推动自动化工具落地,提升团队效率和质量; 负责运维服务过程中的问题处理及管控进度,并对项目实施及售后服务工作持续优化; 负责编写数据中心运维文档,包括数据中心基础设施,设备维护手册、故障处理 SOP 等; 负责设备生命周期的过程优化和治理,完成产品的线上化推进过程的风险管控和保障; 负责资源交付、设备运维、供应商及IDC数据中心IT管理,持续完善标准流程规范制定; 具有较强的分析问题解决问题的能力,具有良好的团队沟通协作能力; 根据需要为多个团队提供远程服务,包括重启、测试/故障排除等; 建设交付及压力测试,数据中心平面图,机柜立面图、机电安装图,容量文档,资产管理和其他必要的设计文件; 数据中心智能化,信息化建设和管理。
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。