阿里云阿里云智能-AI网络资源方案专家-杭州
任职要求
1.至少5年以上网络设备供应链或研发设计经验 2.严谨细致、责任心、计划周全、有自驱力 3.高效的…
工作职责
对阿里云AI基础设施中网络资源供应负责,包含网络设备、路由器、光模块和AOC/DAC。从项目启动的网络资源全局规划、资源方案、供应路径到整体齐套到货,对AI项目组负责。 1. 全局统筹规划AI相关的各个网络设备(含部件/光模块)厂商产能,从厂商物料齐套到排产上线、确保按时产出; 2. 熟悉数据中心网络架构,网络产品技术迭代和主流的网络拓扑,构建适合业务场景的计划策略如安全库存和日常计划策略; 3. 对VMI、CMI、IDC资源池库存水位和库存消耗负责,包含库存风险监控、预警,制定消耗方案,推动及时处置; 4. 熟悉供应链的供需存管理,承接AI业务需求,基于AI相应的网络架构按期到货。推动落地网络设备按时按要求上架。By AI项目保障项目交付SLA达成; 5. 了解行业动态,熟悉数据中心从项目发起到网络资源方案流转流程和系统;确保网络资源方案落地; 6. 熟悉数据中心硬件设计、有数据中心网络硬件研发和售前工作者优先。
对阿里云AI基础设施中网络资源供应负责,包含网络设备、路由器、光模块和AOC/DAC。为了应对中美关税政策、各个国家的关税变动,构建适合业务场景的全球网络资源生产工厂和产能布局。 1. 全局统筹规划阿里各个网络设备(含部件/光模块)AVL厂商全球产能,从厂商物料齐套到排产上线、确保按时产出; 2. 基于网络主计划的需求,对各个网络设备/部件厂商的产出及时性负责,达成相应的生产SLA; 3. 熟悉数据中心网络架构,网络产品技术迭代和主流的网络拓扑,构建适合业务场景的计划策略如安全库存和日常计划策略; 4. 负责所有网络(含部件/光模块)AVL厂商的全球供应链管理,定期参与QBR并针对各个厂商表现评分并进行相应的改进措施优化并确保落地,不断提高各个厂商的供应链服务能力; 5. 对所有网络(含部件/光模块)的可供应性和延续性负责,多工厂备份、多原材料设计冗余、有效管理single source风险并制定相应的规避措施确保供应连续性; 6. 有网络设备全球化供应链管理、国际化工厂运营工作经验者优先。
1、负责GPU相关产品的资源规划,保障资源合理布局和高效运转; 2、负责重大项目资源交付方案设计和执行落地; 3、通过数据驱动,降低离线资源比例,提升经营健康度; 4、协同建设相关平台能力。
1、面向AI大规模训练与推理、大数据处理、函数计算等新兴场景对大规模组网和高并发网络资源弹性提出的严苛需求,主导云网络控制面整体技术架构的设计,为云网络控制面的长期技术竞争力提供坚实支撑; 2、面向云网络业务的长期稳定性,设计云网络控制面的中长期架构治理、架构革新的技术方案和规划,建设配套运维运营基础设施并推动落地; 3、探索实践AI coding应用于控制面日常研发和运维的新范式,持续提升云网络研发和运维效率; 4、通过进一步规范资源交付体系和交付工具设计,提升包括AI集群等资源的交付效率。
1. 算法设计与开发 -针对云计算基础设施资源的需求计划、供需匹配、采购决策和库存管理等场景,建立数学模型并设计求解算法(如线性规划、强化学习、仿真推演等)。 -设计并研发基于大模型(LLM)智能问答(QA)、推理分析(如Chain-of-Thought, ReAct)的agentic AI助手,提升资源运营效率。 2. 工程落地与优化 -将算法从原型推进到生产环境上线,并可解决实际运营业务场景中的规模化和时效性挑战。 -提供运营业务人员可通过自然语言直接交互并高效可用的Agentic AI助手。 -与工程团队合作,设计高性能、可扩展的算法服务架构。 3. 跨领域协作 -与云产品(需求侧)、供应链、采购、数据中心运营等多个团队紧密合作,理解业务痛点并转化为可量化的技术问题。 -跟踪学术界(如OR、ML顶会)和工业界(如AWS/GCP资源优化方案)最新进展,推动技术迭代。