logo of bytedance

字节跳动基础设施运维管理专家-Data(广州)

社招全职3年以上A98277地点:广州状态:招聘

任职要求


1 、电气、暖通、自动化等相关专业;
2 、具有三年以上数据中心基础设施项目管理经验,熟悉数据中心配电、暖通、监控、消防等系统架构、运行操作与管理流程;
3 、熟悉国内数据中心基础设施建设标准规范和运行管理要求,了解国内数据中心前沿技术和产…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1 、参与租用数据中心项目规划建设,追踪进度、推动沟通、预知风险,负责租用数据中心项目基础设施测试验收及接管,保障项目顺利交付;
2 、负责国内租用数据中心基础设施运营,保障稳定、探索优化,完善机房管理;
3 、负责机房操作审核、事件上报及故障跟踪处理,提升机房服务能力;
4、追求更高可靠性和更低能耗。
包括英文材料
相关职位

logo of bytedance
社招3年以上A137727

1 、负责抖音自建数据中心园区(百兆瓦级)暖通系统的日常运维管理,管理机房暖通系统相关的变更、事件应急、故障追踪处理等工作,有效保障数据中心运维稳定性; 2、负责自建数据中心园区项目设计阶段运维需求、图纸审核,建设阶段施工质量管理,测试阶段暖通专业测试组织、问题销项,保证数据中心高质量交付; 3、负责自建数据中心园区第三方代维团队人员招聘、能力培训、考核、提升,打造高素质的、技术能力强的专业运维团队; 4、负责自建数据中心园区暖通专业相关设备的日常维护、维保和故障处理,并高效协调相关设备厂商完成; 5、提升机房服务能力,优化暖通系统运行能效水平,管理数据中心PUE,支持基于平台的运维体系完善和迭代。

更新于 2025-01-02呼和浩特
logo of aliyun
社招8年以上云智能集团

负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1.定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2.构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3.超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。

更新于 2026-01-09杭州
logo of aliyun
社招5年以上云智能集团

1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。

更新于 2025-08-13河源
logo of aliyun
社招10年以上云智能集团

1、日常运维:负责电气(高低压配电、UPS、柴油发电机等)或暖通(冷水机组、精密空调、BA自控系统等)系统的日常运行、巡检、预防性维护及应急响应,保障系统99.99%+可用性,严格达成SLA要求;主导制定并落地操作规程、维保计划与应急预案; 2、安全与合规:严格执行安全生产规范,主动识别电气/暖通领域的安全、消防、能效等风险,推动隐患整改闭环,杜绝责任事故,确保符合国家法规及集团合规标准; 3、优化改进:基于运行数据持续优化系统控制策略,提升PUE等关键能效指标;参与成本结构与人效分析,精细化与智能化运营; 4、技术支撑:深度参与新建/改造项目的设计评审、设备选型与验收测试,输出专业建议;高效协同相关团队为业务部署与稳定运行提供基础设施保障; 5、团队管理:参与团队能力建设和新人带教;高效对接供应商、运营商、监管单位,确保运维质量、服务履约与合规要求有效落地。

更新于 2026-01-15乌兰察布|河源|中卫