logo of aliyun

阿里云阿里云智能-IDC技术研发-智能监控专家-杭州/北京

社招全职技术类-运维地点:北京 | 杭州状态:招聘

任职要求


• 拥有数据中心、电力行业或工业自动化相关数字化平台交付、设计或研发工作经验;
• 熟悉数据采集、协议栈(如Modbus、OPC、BACnet等)、边缘计算和数据处理等技术。具备系统集成能力,能够将多种监控系统进行整合和优化。
• 深入了解电力监控、暖通监控等相关系统架构和技术知识,具备数据中心或电力、工业自…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


阿里自研监控平台的设计/交付/创新
• 负责阿里自研数据中心本地化平台的应用规划和设计,并推动落地实施。
• 深入挖掘业务需求,开展业务调研需求收集,运用数字化,智能化手段解决业务通痛点。
• 建立并完善数据中心基础设施的数字化模型,为自动化、智能化运营提供可靠的技术和数据支持。
• 与开发、运维团队等其他业务团队紧密协作,构建并迭代创新的平台能工解决方案,提升数据中心基础设施的整体管理水平。
• 起草和修改阿里数据中心监控平台的技术规范,编写和修改相关功能的各项技术要求。
• 依据业务诉求丰富平台能力设计,对园区型数据中心从平台功能设计、平台交付集成商管理,到施工期间进行全过程的技术管控,同时联合测试团队定制验收标准,确保业务功能落地。
• 承担产品交付管理工作,依据项目落地情况推进产品的持续优化和架构适配迭代,确保产品价值持续提升。
包括英文材料
相关职位

logo of aliyun
社招5年以上云智能集团

1、市场空间和需求洞察:负责边缘云及边缘网络产品的市场空间调研、客户画像、竞品分析、应用场景和商业模式分析; 2、产品需求管理和设计:负责边缘云及边缘网络产品的需求规划和拆解,并深度参与产品实现方案设计,包括但不限于产品控制台、后台运维运营及监控系统等用户界面系统,以及计算、网络、存储、AI推理、专线上云、云边端组网等后端功能类别,数据库、安全等跨产品合作解决方案,对产品用户体验和竞争力负责; 3、产品定价和商业模式设计:设计并实现边缘云及边缘网络基础产品的商业化方案和定价,确保产品定价策略与市场竞争形式相匹配,产品商业模式可满足客户实际业务需求; 4、产品成本模型优化:了解产品全生命周期的每一项成本构成、影响因素及使用情况,不断推动研发和供应链,通过架构升级和技术突破等手段,优化产品成本结构、降低产品运营成本; 5、跨团队协同:与BTE、SA、PDSA/运营、研发、测试、BI、运维、供应链等多方角色协同工作,做好项目管理工作,确保产品业务目标有序达成,产品路标和重点需求如期发布,产品端到端交付效率持续提升; 6、流程机制设计:负责产品全生命周期持续迭代优化,通过合理的流程机制设计,发现并解决关键瓶颈和卡点,持续提升产品开发和运营效率。

更新于 2025-12-28北京|杭州
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云全球IDC机房基础设施运维技术管理,制定并持续优化IDC基础设施运维标准、流程、质量分析模型,提升运维专业化水平,实现对IDC稳定性管理的技术、管理覆盖。 2. 负责阿里云全球IDC运维自控专业线能力建立,协助一线运维团队建立自控专业梯队。 3. 阿里云全球IDC稳定性事件应急响应,支撑一线运维进行自控系统应急故障处理。 4. 主导阿里云全球IDC运维稳定性飞检,识别自控系统架构风险,协助一线运维团队推动风险闭环。 5. 进行IDC自控及数字化技术探索,建立自控专业运维的数字化、自动化、AIOps能力。 6. 整合运维技术优化需求,对接研发、设计等团队完成需求落地;参与IDC自控新技术、新架构升级的评估,输出运维视角的评估建议。

更新于 2025-08-18杭州
logo of aliyun
社招5年以上技术类-开发

数据中心运营平台团队的使命是实现服务器、IDC等基础设施整个运营领域的全面产品化支撑,从而达到高效率,低成本,低功耗的智能运维。集成了服务器和IDC领域的各项专业技术,以及运维平台进一步的智能化支持,我们立志打造一个真正自动驾驶的数据中心。 作为服务器领域开发专家,您将负责: 1. 负责服务器采集监控机制的定义与优化,包括定义采集的数据,频率以及后续业务应用方式。 2. 负责服务器性能、功耗等数据的分析与应用,提取业务特征,分析业务瓶颈并优化。 3. 基于ARM/X86架构,以及各类AI等异构架构的场景,完善监控与运维手段。 4. 基于故障宕机等场景,从集群角度增强服务器容灾与带故障运行的能力,可用性与稳定性。 5. 基于服务器领域知识与智能化相结合,运用智能化手段管理服务器。 6. 支撑单元化等特殊服务器集群管理场景。

更新于 2025-06-30杭州
logo of aliyun
社招5年以上云智能集团

对阿里云AI基础设施中网络资源供应负责,包含网络设备、路由器、光模块和AOC/DAC。从项目启动的网络资源全局规划、资源方案、供应路径到整体齐套到货,对AI项目组负责。 1. 全局统筹规划AI相关的各个网络设备(含部件/光模块)厂商产能,从厂商物料齐套到排产上线、确保按时产出; 2. 熟悉数据中心网络架构,网络产品技术迭代和主流的网络拓扑,构建适合业务场景的计划策略如安全库存和日常计划策略; 3. 对VMI、CMI、IDC资源池库存水位和库存消耗负责,包含库存风险监控、预警,制定消耗方案,推动及时处置; 4. 熟悉供应链的供需存管理,承接AI业务需求,基于AI相应的网络架构按期到货。推动落地网络设备按时按要求上架。By AI项目保障项目交付SLA达成; 5. 了解行业动态,熟悉数据中心从项目发起到网络资源方案流转流程和系统;确保网络资源方案落地; 6. 熟悉数据中心硬件设计、有数据中心网络硬件研发和售前工作者优先。

更新于 2025-11-12杭州