阿里云阿里云智能-服务器PSU电源技术专家-AI领域-深圳/杭州
任职要求
1.具备电力电子技术、电气工程或自动控制等相关领域的深厚学术背景,拥有至少五年的CRPS电源及其集中供电架构(涵盖power shelf、PSU及PMC等组件)的设计与实施经验。在此过程中,展现出优秀的原理图审查能力、生产工艺流程优化技巧以及解决复杂质量问题的专业素养; 2.不少于 3 年针对不同功率等级CRPS电源及大规模集中式供电系统进行测试的实际操作经历。此外,还应该熟悉单机白盒测试方法,并且能够将电源与整个系统(包括但不限于ACV, SIT, thermal, RE…
工作职责
1.阿里电源PSU技术规范制定和维护,确保阿里服务器PSU制造商遵循阿里标准;定期分析总结阿里电源应用表现,针对问题提出优化方向并验证,纳入规范,实现产品技术&质量大闭环; 2.负责阿里服务器PSU的引入,保障EDM/ODM整机制造商及自主研发项目中PSU组件的引入质量和进度; 3.负责PSU组件线上质量看护,针对批量问题快速定位分析,给出整改意见; 4.负责EDM/ODM整机制造商生产发现PSU问题管理和根因分析,确保交付质量; 5.协调解决PSU组件与其他相关领域,如IDC数据中心、BMC兼容性、服务器品质保证、运维支持、自维保备件各种问题。
特斯拉正在寻找一位富有激情和丰富经验的数据中心工程师加入我们的IT基础设施及运营团队,负责数据中心基础设施,理想的候选人具备丰富的设计,建造以及维护数据中心基础设施的能力,包括但不限于计算机、通信、流程管理,电力,暖通和智能化等领域的专业知识,候选人将会帮助我们建造下一代数据中心来保障我们的IT基础设施99.99%可用。 岗位职责 负责数据中心业务连续稳定、制定并达成SLA、参与新数据中心的建设、现有数据中心的扩展以及包括计算、存储、网络和其他基础设施组件在内的部署; 负责参与数据中心服务器,网络设备部署、资产管理、上架、布线及硬件资源规划; 负责服务器硬件(CPU、内存、硬盘、RAID卡、网卡、电源等)的安装、调试、维护及故障排查; 负责制定流程规范、推动自动化工具落地,提升团队效率和质量; 负责运维服务过程中的问题处理及管控进度,并对项目实施及售后服务工作持续优化; 负责编写数据中心运维文档,包括数据中心基础设施,设备维护手册、故障处理 SOP 等; 负责设备生命周期的过程优化和治理,完成产品的线上化推进过程的风险管控和保障; 负责资源交付、设备运维、供应商及IDC数据中心IT管理,持续完善标准流程规范制定; 具有较强的分析问题解决问题的能力,具有良好的团队沟通协作能力; 根据需要为多个团队提供远程服务,包括重启、测试/故障排除等; 建设交付及压力测试,数据中心平面图,机柜立面图、机电安装图,容量文档,资产管理和其他必要的设计文件; 数据中心智能化,信息化建设和管理。
1、负责服务器运维的硬件/软件类日常运行维护,线上问题排查、故障处理及疑难问题诊断分析; 2、负责服务器类产品形态的运维评估、监控、调优,诊断、硬件性能优化及工具化开发; 3、负责运维服务过程中的问题处理及管控进度,并对项目实施及售后服务工作持续优化; 4、负责设备生命周期的过程优化和治理,完成产品的线上化推进过程的风险管控和保障; 5、负责资源交付、设备运维、供应商及IDC数据中心IT管理,持续完善标准流程规范制定; 6、负责服务生命周期的产品管理,运维可行性评估,和产品周期的运维质量风险管控。
1、负责服务器运维的硬件/软件类日常运行维护,线上问题排查、故障处理及疑难问题诊断分析; 2、负责服务器类产品形态的运维评估、监控、调优,诊断、硬件性能优化及工具化开发; 3、负责运维服务过程中的问题处理及管控进度,并对项目实施及售后服务工作持续优化; 4、负责设备生命周期的过程优化和治理,完成产品的线上化推进过程的风险管控和保障; 5、负责资源交付、设备运维、供应商及IDC数据中心IT管理,持续完善标准流程规范制定; 6、负责服务生命周期的产品管理,运维可行性评估,和产品周期的运维质量风险管控。