阿里云阿里云智能-服务器质量工程高级技术专家-质量工程
社招全职8年以上云智能集团地点:深圳 | 杭州状态:招聘
任职要求
1、通讯、计算机、电子工程相关专业,有扎实的计算机底层硬件基础知识; 2、从事8年以上的服务器/存储/核心路由器硬件开发和维护工作,熟悉异构服务器的硬件架构、精通数字电路、模拟电路设计,具备全流程硬件产品开发、制造、服务相关经验者优先; 3、熟悉BIOS、BMC、FW、结构、AC/DC电源、信号仿真、散热、测试等领域知识,可以组织各团队完…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责AI异构服务器(搭载NVIDIA/AMD/国产AI芯片)的端到端交付质量保障和线上运维,负责搭建异构服务器的可靠性评估以及预测体系,风险应急以及恢复体系; 2、对标业界标杆,引入先进质量运维管理方法,并制定相关产品的全流程质量运维管控方案并主导实施,开展供应商质量审核、质量体系评估、运维能力管理,确保改善措施的有效实施; 3、主导分析解决和预防重大产品质量运维问题,主导产品质量问题分析、定位及质量问题的处理与预防; 4、持续跟踪硬件相关领域的技术发展趋势,结合对阿里业务应用场景的深入分析,并推动相关技术的产品化实现。
包括英文材料
相关职位
社招3年以上技术类-开发
1. 负责Accio AI产品的研发,包括需求分析,系统设计,用 AI IDE 写代码,编写单测,模块数据分析,监控运维等; 2. 能够进行技术攻坚,架构优化,性能优化,并能能够自驱定义问题,解决问题,追过程,拿结果; 3. 主观能动性好,能够持续学习,特别是 AI 技术的发展和落地应用,提升产品效果,工程效率,技术先进性。
更新于 2025-07-28杭州
社招8年以上云智能集团
1. 针对整机柜服务器产品进行全面的计算、互联、监控等能力的全面赋能和开发; 2. 寻找适合于整机柜异构服务器产品的业务产品并进行对应的昆仑组件设计和开发,包含性能评测分析、容器镜像等 3. 针对整机柜硬件架构及业务落地场景,构建故障异常case并能设计故障诊断方案; 4. 负责跟踪及研究主流GPU架构设计技术,参与下一代AI Infra的设计; 5. 根据业务画像,构建有竞争力的异构硬件和系统全链路的量化分析,形成数据决策数据库;有效推动异构服务器产品的规划和落地。
更新于 2025-09-09北京|杭州
社招2年以上技术类-开发
1. 负责千问&夸克服务端技术体系的系统分析、设计,并主导完成详细设计和编码的任务,确保项目的进度和质量;主导技术难题攻关,持续提升核心系统的高处理性能; 2. 能够在团队中完成Code Review的任务,确保相关代码的有效性和正确性,并能够通过Code Review提供相关性能和稳定性的建议; 3. 理解业务,识别需求,参与架构、系统、分析设计等多领域项目的相关技术的实践、应用和研发。
更新于 2026-04-03北京|杭州|广州