logo of aliyun

阿里云阿里云智能-IDC技术研发-智能监控专家-杭州/北京

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


• 拥有数据中心、电力行业或工业自动化相关数字化平台交付、设计或研发工作经验;
• 熟悉数据采集、协议栈(如Modbus、OPC、BACnet等)、边缘计算和数据处理等技术。具备系统集成能力,能够将多种监控系统进行整合和优化。
• 深入了解电力监控、暖通监控等相关系统架构和技术知识,具备数据中心或电力、工业自动化行业系统监控、分析、诊断等平台建设实践经验;
• 优秀的逻辑思维和分析能力,能将复杂的业务需求抽象成具体的产品功能。
• 熟悉数据中心基础设施的数字化转型,具备跨领域(电力、暖通、自动化)的技术整合能力,能够将复杂业务需求转化为可落地的产品方案,具有卓越的沟通能力和团队协作精神,能够协调多方资源达成目标。

工作职责


阿里自研监控平台的设计/交付/创新
• 负责阿里自研数据中心本地化平台的应用规划和设计,并推动落地实施。
• 深入挖掘业务需求,开展业务调研需求收集,运用数字化,智能化手段解决业务通痛点。
• 建立并完善数据中心基础设施的数字化模型,为自动化、智能化运营提供可靠的技术和数据支持。
• 与开发、运维团队等其他业务团队紧密协作,构建并迭代创新的平台能工解决方案,提升数据中心基础设施的整体管理水平。
• 起草和修改阿里数据中心监控平台的技术规范,编写和修改相关功能的各项技术要求。
• 依据业务诉求丰富平台能力设计,对园区型数据中心从平台功能设计、平台交付集成商管理,到施工期间进行全过程的技术管控,同时联合测试团队定制验收标准,确保业务功能落地。
• 承担产品交付管理工作,依据项目落地情况推进产品的持续优化和架构适配迭代,确保产品价值持续提升。
包括英文材料
相关职位

logo of aliyun
社招技术类-运维

阿里自研监控平台的设计/交付/创新 • 负责阿里自研数据中心本地化平台的应用规划和设计,并推动落地实施。 • 深入挖掘业务需求,开展业务调研需求收集,运用数字化,智能化手段解决业务通痛点。 • 建立并完善数据中心基础设施的数字化模型,为自动化、智能化运营提供可靠的技术和数据支持。 • 与开发、运维团队等其他业务团队紧密协作,构建并迭代创新的平台能工解决方案,提升数据中心基础设施的整体管理水平。 • 起草和修改阿里数据中心监控平台的技术规范,编写和修改相关功能的各项技术要求。 • 依据业务诉求丰富平台能力设计,对园区型数据中心从平台功能设计、平台交付集成商管理,到施工期间进行全过程的技术管控,同时联合测试团队定制验收标准,确保业务功能落地。 • 承担产品交付管理工作,依据项目落地情况推进产品的持续优化和架构适配迭代,确保产品价值持续提升。

更新于 2025-05-28
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云全球IDC机房基础设施运维技术管理,制定并持续优化IDC基础设施运维标准、流程、质量分析模型,提升运维专业化水平,实现对IDC稳定性管理的技术、管理覆盖。 2. 负责阿里云全球IDC运维自控专业线能力建立,协助一线运维团队建立自控专业梯队。 3. 阿里云全球IDC稳定性事件应急响应,支撑一线运维进行自控系统应急故障处理。 4. 主导阿里云全球IDC运维稳定性飞检,识别自控系统架构风险,协助一线运维团队推动风险闭环。 5. 进行IDC自控及数字化技术探索,建立自控专业运维的数字化、自动化、AIOps能力。 6. 整合运维技术优化需求,对接研发、设计等团队完成需求落地;参与IDC自控新技术、新架构升级的评估,输出运维视角的评估建议。

更新于 2025-08-18
logo of aliyun
社招5年以上技术类-开发

数据中心运营平台团队的使命是实现服务器、IDC等基础设施整个运营领域的全面产品化支撑,从而达到高效率,低成本,低功耗的智能运维。集成了服务器和IDC领域的各项专业技术,以及运维平台进一步的智能化支持,我们立志打造一个真正自动驾驶的数据中心。 作为服务器领域开发专家,您将负责: 1. 负责服务器采集监控机制的定义与优化,包括定义采集的数据,频率以及后续业务应用方式。 2. 负责服务器性能、功耗等数据的分析与应用,提取业务特征,分析业务瓶颈并优化。 3. 基于ARM/X86架构,以及各类AI等异构架构的场景,完善监控与运维手段。 4. 基于故障宕机等场景,从集群角度增强服务器容灾与带故障运行的能力,可用性与稳定性。 5. 基于服务器领域知识与智能化相结合,运用智能化手段管理服务器。 6. 支撑单元化等特殊服务器集群管理场景。

更新于 2025-06-30
logo of bytedance
实习A46364

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、参与LLVM/GCC,LTO/IPA/PGO/Propeller/MemProf等高级编译器技术的研发与落地; 2、协助C++语言新标准的落地,新编译技术及工具链版本发布落地。

更新于 2025-02-24