logo of alibaba

阿里巴巴基础设施与稳定性工程-AI Infra数据科学家-基础设施资源管理

社招全职3年以上技术类-数据地点:杭州状态:招聘

任职要求


1、本科及以上学历,计算机科学、统计学、数学、电子工程或相关专业;
2、3 年以上数据开发、数据分析或AI Infra相关工作经验;
3、有 AI Infra或云计算平台相关数据开发或者研发经验者优先;了解 AI 基础设施架构(GPU 资源调度、RDMA 网络…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、整合 GPU/CPU 算力、存储(如 CPFS)、网络(如 RDMA/InfiniBand)、供应链流转等多维度数据,构建资源使用率、成本结构与供需分析模型,输出可落地的优化建议;
2、整合资源效能和业务性能指标(如MFU、TPM、TPOT、GPU 利用率等),建立资源效能评估模型,量化资源投入与业务产出之间的关系,为资源规划与采购决策提供数据支撑;
3、负责 AI Infra 资源数仓的数据链路设计与建设,覆盖数据采集、清洗、加工、存储与服务全流程,保障资源数据的准确性、一致性与时效性;
4、构建并维护资源数据可视化平台,开发资源热力图、利用率趋势、成本分摊仪表盘等,支撑日常运营与管理层决策;
5、与资源运营、财务、研发等团队紧密协作,搭建资源生命周期关键指标看板,定期输出资源效能分析报告,支撑资源采购与部署策略落地。
包括英文材料
学历+
数据分析+