logo of bytedance

字节跳动数据中心运维技术专家-Data

社招全职5年以上A105571A地点:北京状态:招聘

任职要求


1、抗压能力强,能承担较高的工作压力,有良好的团队合作精神;具有数据中心运维、测试等相关5年以上工作经验;
2、熟悉数据中心架构及各类设备,具备架构设计经验;
3、熟悉数据中心行业设计和产品规范,具备数据中心设计和设备深化图纸评审能力;
4、良好的沟通能力及逻辑分析能力,工作严谨且责任心强;
5、具备较强的提炼总结和文档撰写能力。

工作职责


1、负责数据中心重大技术问题(电气/自控等)处理,推动技术问题解决和关闭,对技术咨询予以解答;
2、负责数据中心新技术落地支持与新技术迭代,验证新技术的可行性或确保新技术在机房的稳定落地;
3、支持数据中心项目专业技术交付(含审图、施工检查、设备调试及质量控制、测试验收指导、问题销项推动及运维风险管理等);
4、支持数据中心项目招标采购技术管理与技术评估;
5、支持数据中心运维技术标准和迭代各类技术标准及指导书。
包括英文材料
系统设计+
相关职位

logo of bytedance
社招3年以上A137727

1 、负责抖音自建数据中心园区(百兆瓦级)暖通系统的日常运维管理,管理机房暖通系统相关的变更、事件应急、故障追踪处理等工作,有效保障数据中心运维稳定性; 2、负责自建数据中心园区项目设计阶段运维需求、图纸审核,建设阶段施工质量管理,测试阶段暖通专业测试组织、问题销项,保证数据中心高质量交付; 3、负责自建数据中心园区第三方代维团队人员招聘、能力培训、考核、提升,打造高素质的、技术能力强的专业运维团队; 4、负责自建数据中心园区暖通专业相关设备的日常维护、维保和故障处理,并高效协调相关设备厂商完成; 5、提升机房服务能力,优化暖通系统运行能效水平,管理数据中心PUE,支持基于平台的运维体系完善和迭代。

更新于 2025-01-02
logo of bytedance
社招3年以上A98277

1 、参与租用数据中心项目规划建设,追踪进度、推动沟通、预知风险,负责租用数据中心项目基础设施测试验收及接管,保障项目顺利交付; 2 、负责国内租用数据中心基础设施运营,保障稳定、探索优化,完善机房管理; 3 、负责机房操作审核、事件上报及故障跟踪处理,提升机房服务能力; 4、追求更高可靠性和更低能耗。

更新于 2025-02-19
logo of bytedance
社招3年以上A245331

1、负责字节跳动全球百万级服务器硬件监控体系及自动化运维体系的建设工作;深度参与线上新机型、新硬件及新场景的硬件监控方案制定与适配流程,精准定义并持续完善各类硬件故障判断标准,显著提升硬件监控的准确率与召回率,为服务器稳定运行保驾护航; 2、针对线上复杂的服务器硬件疑难故障,依托服务器底层黑盒日志(如BMC日志、IPMI/SMBIOS数据、操作系统内核日志、硬件事件日志等)展开深度分析;协同内外部软硬件研发专家,实现疑难故障的精准根因定位;积极推动线上疑难故障自动化诊断分析能力建设,不断提高硬件故障监控诊断明确化率与报修维修一致率,有效降低故障返修率; 3、负责线上服务器监控相关Oncall问题的快速排查、精准定位与深度分析,及时为团队提供专业答疑;建立并完善硬件故障知识库,系统沉淀典型故障案例及高效排查方法论,助力团队整体技术能力提升。

更新于 2025-03-06
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云全球IDC机房基础设施运维技术管理,制定并持续优化IDC基础设施运维标准、流程、质量分析模型,提升运维专业化水平,实现对IDC稳定性管理的技术、管理覆盖。 2. 负责阿里云全球IDC运维电气专业线能力建立,协助一线运维团队建立电气专业梯队。 3. 阿里云全球IDC稳定性事件应急响应,支撑一线运维进行电气系统应急故障处理。 4. 主导阿里云全球IDC运维稳定性飞检,识别电气系统架构风险,协助一线运维团队推动风险闭环。 5. 进行IDC电气技术探索,建立电气专业运维的数字化、自动化、AIOps能力。 6. 整合运维技术优化需求,对接研发、设计等团队完成需求落地;参与IDC电气新技术、新架构升级的评估,输出运维视角的评估建议;参与安全合规。

更新于 2025-08-18