logo of aliyun

阿里云阿里云智能-高级产品制造工程专家-维修工程-杭州

社招全职10年以上云智能集团地点:杭州状态:招聘

任职要求


• 对云计算、IDC和AI相关产品有较深了解且参与过相关项目,特别是GPU模组级别FA维修和行业生态有较深理解
• 熟悉制造和硬件工程各领域流程和标准,能够给予业务需求和趋势变…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


· 业务规划:建立以公司级AI服务器维修为基础的交付解决方案和体系,支撑AI服务器的在线利用率提升
· 制造技术和管理:加强AI产品制造、改配和维修的制造技术投入,构建服务器维修工程能力体系,推进器件、部件、整机、服务商能力的逆向供应链体系能力建设,以工程技术提升维修交付的效率
· 生产和交付质量:构建维修的生产和交付的全链路标准工艺和测试流程,并设计和管理关键的质量体系
· 产能规划和能力建设:服务商评估、引入和管理,维修产能建设,全链路能力提升
· 改配和自维保:建设和持续优化改配、自维保体系,并加强改配和自维保的制造技术和质量方案,在在线业务、利旧、AI的改配和维保供应技术能力等方向上持续提升资源利用率,实现降本增效的价值创造。
包括英文材料
相关职位

logo of aliyun
社招10年以上云智能集团

· 业务规划:建立以产品制造工程为基础的交付解决方案和体系,支撑供应链领域产品制造、仓配、交付、改配、维保和质量。 · 制造技术和管理:加强平台型和AI产品、制造、改配、维修的制造技术投入,制造技术量产一代、预研一代,高功耗产品从风冷制造向液冷制造规划和转型;构建服务器制造工程能力体系,推进器件、部件、工艺、设备、测试、维修等工程能力迭代和管理变更,监控厂商实际落实执行,协同解决交付异常,以工程技术提升制造质量和效率。 · 新产品引入:构建产品生命周期的供应链管理,负责新产品的工厂量产导入,协同研发在自研产品和自研部件设计阶段的DFx以提升产品可制造性和可维护性,做好新产品上量早期阶段的制造技术落地和质量管理,推进厂商制造能力和环境建设优化,提升产品导入效率和质量。 · 量产标的产品复制:主导从1到100的量产标的产品复制,革新式的建立产品快速复制流程实现产品复制从行业标准6个月降至3个月;并做好立项、退出的复制过程风险管控体系,以PLM和SLM为基础,以项目制管理方式提升和优化流程体系,把控项目立项、退出等关键节点,建立风险管理体系。 · 生产和交付质量:构建服务器和关键部件的质量管理体系,加强数字化能力建设,监督和提升部件/整机厂商在物料来料、生产制造、物流仓储、上架交付等全流程质量水平,负责制造过程异常处理和交付保障,服务于交付各领域。 · 产能规划和能力建设:依据标案及交付需求,识别产能瓶颈和风险,优化产品交付模式,提供全球范围内产能优化方案并推动厂商建设、验证、批量交付完成,实现全球供应投放能力的建设。 · 改配交付:建设和持续优化改配体系,并加强改配制造技术和质量提升,在IDC改配、CDN改配、AI改配等方向上持续提升资源利用率,实现降本增效的价值创造。 · 自维保:建设和持续优化自维保体系,用制造和维修技术提升备件拆解、备件NTF、备件维修和现场维修的能力,持续提升自维保的价值创造能力,并做好自维保基础能力的建设,为风险预防做好能力基础。 · 供应商管理:构建“六边形”战士的厂商绩效评价机制,通过MOR运作机制提升厂商供应链领域的能力和绩效,设计和执行MOR奖惩制度,并提升MOR绩效在招投标中的份额影响度,使运营管理与商务、研发协同良性循环。 · 交付解决方案:负责重点项目的供应、生产、质量、仓配、上架的交付解决方案设计和落地,构建国内、海外供应链安全体系。

更新于 2026-01-13杭州
logo of aliyun
社招10年以上云智能集团

· 业务规划:建立以公司级AI服务器维修为基础的交付解决方案和体系,支撑AI服务器的在线利用率提升 · 制造技术和管理:加强AI产品制造、改配和维修的制造技术投入,构建服务器维修工程能力体系,推进器件、部件、整机、服务商能力的逆向供应链体系能力建设,以工程技术提升维修交付的效率 · 生产和交付质量:构建维修的生产和交付的全链路标准工艺和测试流程,并设计和管理关键的质量体系 · 产能规划和能力建设:服务商评估、引入和管理,维修产能建设,全链路能力提升 · 改配和自维保:建设和持续优化改配、自维保体系,并加强改配和自维保的制造技术和质量方案,在在线业务、利旧、AI的改配和维保供应技术能力等方向上持续提升资源利用率,实现降本增效的价值创造。

更新于 2025-11-12杭州
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳
logo of xiaohongshu
社招3年以上机器学习平台

1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系

北京|上海|深圳