logo of alibaba

阿里巴巴基础设施与稳定性工程-AI Infra资源智能高级专家-杭州

社招全职5年以上技术类-数据地点:杭州状态:招聘

任职要求


基本要求
● 本科及以上学历,计算机、统计学、数学、信息管理等相关专业,5年及以上商业智能(BI)、算法数据分析、数据运营相关工作经验,3年及以上AI/大数据/云计算基础设施领域BI或数据分析经验;有AI算力交付、资源管理、云厂商/AI企业BI团队管理经验者优先。
● 具备扎实的数据分析功底,熟悉SQL、Python等数据分析工具,能独立完成从数据取数、分析建模到可视化落地的全流程工作。

专业技能
● 深度熟悉AI基础设施业务场景,理解算力集群(GPU/CPU)、模型训练/推理流程、资源调度、算力交付、成本核算等核心业务逻辑,能快速梳理业务数据指标与分析逻辑。
● 精通数据仓库建模理论,熟悉维度建模,能独立设计AI基础设施领域的数据仓库模型,具备多源异构数据(结构化算力数据、监控日志、业务交易数据)整合与分析能力。
● 熟练掌握大数据分析工具与技术,能高效处理海量算力数据、运维…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位概述:
负责构建面向AI算力交付、资源管理、成本核算与业务运营的全链路BI体系。通过深度洞察AI算力流转、集群性能、资源利用率,设计智能化、可视化的决策分析平台,为AI资源管理团队、算力交付部门及高层提供精准的数据驱动决策支持,赋能算力资源优化配置、成本精细化治理与业务增长目标达成

岗位职责:
● AI Infra BI体系设计与建设
结合AI基础设施(算力集群、模型训练/推理、资源调度、成本核算)的业务特性,设计全链路BI数据架构,搭建覆盖算力交付、资源利用率、性能指标、成本消耗、业务产出的一站式数据分析平台;制定BI指标体系、数据口径规范与分析方法论,构建长期可演进的BI分析框架,支撑AI基础设施全生命周期运营管理。
● 核心BI分析场景落地与赋能
算力交付分析:对接AI算力交付全流程数据,分析算力供给、需求匹配、交付效率、客户/业务线算力消耗分布,定位交付瓶颈与优化空间,支撑算力交付策略与SLA达成。资源管理分析:基于AI资源管理平台数据,深度分析集群资源利用率、调度效率、资源争抢、闲置率等核心指标,输出资源优化方案,提升资源整体利用率与周转效率。成本精细化分析:搭建AI算力成本核算BI体系,分析不同业务线/模型/项目的成本收益比,实现成本精细化管控与降本增效。
● BI可视化平台与数据产品建设
设计并迭代BI可视化看板(如资源利用率看板、成本分析看板、交付进度看板),实现核心数据的实时/准实时展示与多维度钻取;推动BI数据产品化,将分析逻辑沉淀为可复用的分析工具/模板,降低数据查询门槛,提升数据获取效率。
● 跨部门数据协同与决策支持
深度对接算法团队、资源管理团队、商务团队,理解各角色数据需求,提供定制化分析报告与决策支持;推动跨部门数据打通与口径统一,解决AI基础设施场景下数据分散、口径不一致等问题,保障数据一致性与可用性。
● 团队管理与技术沉淀
制定团队工作规范与分析标准;沉淀BI分析方法论、数据模型、分析案例,提升团队整体数据洞察能力;跟踪BI前沿技术与AI基础设施领域技术动态,推动技术工具与分析方法的迭代升级。
包括英文材料
学历+
算法+
数据分析+
大数据+
还有更多 •••