logo of baidu

百度数据中心运维质量工程师(J82621)

社招全职3年以上ACG地点:北京状态:招聘

任职要求


-本科及以上学历,电气、暖通、项目管理相关专业优先
-具备大型数据中心3年以上运维质量管理及运营监察经验,对运维体系建设、系统架构及设备原理、风险隐患排查等均有深刻理解
-对数据中心…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责超大规模数据中心集群的运维质量管理
-制定全域数据中心运维服务策略,确保数据中心可靠稳定、能效最高及成本最优
-负责数据中心运维管理规范及运营技术体系建设,打造标准化、可量化、可持续改进的工具方法,推动多中心运维管理规范落地
-负责数据中心的运维监察巡检和质量考核,包括健康度评测、飞检巡检、故障排查、事件通报、质量考核等,监督和考核运维服务能力,技术支持并优化提升
包括英文材料
学历+
相关职位

logo of aliyun
社招2年以上云智能集团

1、日常运维 • 负责数据中心基础设施日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全。 • 通过基础设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的基础设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。

更新于 2025-12-05广州
logo of netease
社招5年以上网易职能

1、负责集团数据中心的基础设施建设、运维管理工作,统筹资源安排,制定数据中心服务策略,确保数据中心安全、可靠、高效运营; 2、负责集团自建机房的项目技术管理,包括电气技术选型、建设交付、测试验收等工作,与总包和设备供应商、监理单位等密切配合,保障新建项目的高效、高质量交付; 2、探索数据中心电气专业前沿技术,负责集团IDC新技术的规划、迭代及落地工作; 3、负责集团数据中心的基础设施现场运维质量、运维成本及运维安全,挖掘项目机会,增强团队影响力; 4、负责集团数据中心电气技术和运营持续优化,追求更高的可靠性、运营高效和最佳成本。

更新于 2025-04-21杭州
logo of tesla
社招5年以上基础架构

特斯拉正在寻找一位富有激情和丰富经验的数据中心工程师加入我们的IT基础设施及运营团队,负责数据中心基础设施,理想的候选人具备丰富的设计,建造以及维护数据中心基础设施的能力,包括但不限于计算机、通信、流程管理,电力,暖通和智能化等领域的专业知识,候选人将会帮助我们建造下一代数据中心来保障我们的IT基础设施99.99%可用。 岗位职责 负责数据中心业务连续稳定、制定并达成SLA、参与新数据中心的建设、现有数据中心的扩展以及包括计算、存储、网络和其他基础设施组件在内的部署; 负责参与数据中心服务器,网络设备部署、资产管理、上架、布线及硬件资源规划; 负责服务器硬件(CPU、内存、硬盘、RAID卡、网卡、电源等)的安装、调试、维护及故障排查; 负责制定流程规范、推动自动化工具落地,提升团队效率和质量; 负责运维服务过程中的问题处理及管控进度,并对项目实施及售后服务工作持续优化; 负责编写数据中心运维文档,包括数据中心基础设施,设备维护手册、故障处理 SOP 等; 负责设备生命周期的过程优化和治理,完成产品的线上化推进过程的风险管控和保障; 负责资源交付、设备运维、供应商及IDC数据中心IT管理,持续完善标准流程规范制定; 具有较强的分析问题解决问题的能力,具有良好的团队沟通协作能力; 根据需要为多个团队提供远程服务,包括重启、测试/故障排除等; 建设交付及压力测试,数据中心平面图,机柜立面图、机电安装图,容量文档,资产管理和其他必要的设计文件; 数据中心智能化,信息化建设和管理。

上海
logo of aliyun
社招3年以上云智能集团

1、负责阿里云全球数据中心基础设施的运营管理,对过程质量、运营数据、KCP指标等开展持续性分析,确保运营服务质量和业务稳定性。 2、负责驱动FOC、ITOC职能运转,拉通业务和数据中心现场等上下游团队,确保事件应急响应及时性和业务连续性。 3、负责将应急管理、质量管理与平台自动化相结合,通过应急调度系统、运营质量分析系统、大数据接入及告警标准化的建设,持续提升数字化、自动化能力。 4、负责数据中心运维管理流程、标准、机制的持续优化,不断提升运维管理技术水平。

更新于 2025-11-20杭州