阿里巴巴基础设施与稳定性工程-AI Infra资源智能高级专家-杭州
社招全职5年以上技术类-数据地点:杭州状态:招聘
任职要求
基本要求 ● 本科及以上学历,计算机、统计学、数学、信息管理等相关专业,5年及以上商业智能(BI)、算法、数据分析、数据运营相关工作经验,3年及以上AI/大数据/云计算基础设施领域BI或数据分析经验;有AI算力交付、资源管理、云厂商/AI企业BI团队管理经验者优先。 ● 具备扎实的数据分析功底,熟悉SQL、Python等数据分析工具,能独立完成从数据取数、分析建模到可视化落地的全流程工作。 专业技能 ● 深度熟悉AI基础设施业务场景,理解算力集群(GPU/CPU)、模型训练/推理流程、资源调度、算力交付、成本核算等核心业务逻辑,能快速梳理业务数据指标与分析逻辑。 ● 精通数据仓库建模理论,熟悉维度建模,能独立设计AI基础设施领域的数据仓库模型,具备多源异构数据(结构化算力数据、监控日志、业务交易数据)整合与分析能力。 ● 熟练掌握大数据分析工具与技术,能高效处理海量算力数据、运维…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位概述: 负责构建面向AI算力交付、资源管理、成本核算与业务运营的全链路BI体系。通过深度洞察AI算力流转、集群性能、资源利用率,设计智能化、可视化的决策分析平台,为AI资源管理团队、算力交付部门及高层提供精准的数据驱动决策支持,赋能算力资源优化配置、成本精细化治理与业务增长目标达成 岗位职责: ● AI Infra BI体系设计与建设 结合AI基础设施(算力集群、模型训练/推理、资源调度、成本核算)的业务特性,设计全链路BI数据架构,搭建覆盖算力交付、资源利用率、性能指标、成本消耗、业务产出的一站式数据分析平台;制定BI指标体系、数据口径规范与分析方法论,构建长期可演进的BI分析框架,支撑AI基础设施全生命周期运营管理。 ● 核心BI分析场景落地与赋能 算力交付分析:对接AI算力交付全流程数据,分析算力供给、需求匹配、交付效率、客户/业务线算力消耗分布,定位交付瓶颈与优化空间,支撑算力交付策略与SLA达成。资源管理分析:基于AI资源管理平台数据,深度分析集群资源利用率、调度效率、资源争抢、闲置率等核心指标,输出资源优化方案,提升资源整体利用率与周转效率。成本精细化分析:搭建AI算力成本核算BI体系,分析不同业务线/模型/项目的成本收益比,实现成本精细化管控与降本增效。 ● BI可视化平台与数据产品建设 设计并迭代BI可视化看板(如资源利用率看板、成本分析看板、交付进度看板),实现核心数据的实时/准实时展示与多维度钻取;推动BI数据产品化,将分析逻辑沉淀为可复用的分析工具/模板,降低数据查询门槛,提升数据获取效率。 ● 跨部门数据协同与决策支持 深度对接算法团队、资源管理团队、商务团队,理解各角色数据需求,提供定制化分析报告与决策支持;推动跨部门数据打通与口径统一,解决AI基础设施场景下数据分散、口径不一致等问题,保障数据一致性与可用性。 ● 团队管理与技术沉淀 制定团队工作规范与分析标准;沉淀BI分析方法论、数据模型、分析案例,提升团队整体数据洞察能力;跟踪BI前沿技术与AI基础设施领域技术动态,推动技术工具与分析方法的迭代升级。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
还有更多 •••