腾讯服务器技术运营高级工程师
任职要求
1.本科及以上学历,3年以上服务器运维相关工作经验,需要对主流x86、ARM、Power平台的服务器硬件有相关运营诊断、优化、部署交付等技术经验。有GPU服务器集群运营与交付经验优先; 2.熟练掌握国内外主流服务器品牌硬件运营知识,能通过服务器诊断工具和脚本对硬件问题诊断分析,有大规模批量集中服务器交付…
工作职责
1.负责服务器整机硬件交付相关工作,包含规模化批量交付流程、工具开发、以及TO B的服务器系统级交付解决方案; 2.负责服务器部件级交付前质量压测、性能测试、异常故障排查、问题分析与优化,保障运营备件交付质量; 3.负责服务器交付测试脚本与自动化工具优化,制定服务器交付技术规格产品化的规划设计与优化建设等工作,提升运营交付质量和效率。
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。
负责运营管理全国服务器自维修,为现场提供深度技术支持,推动服务器维修优化提效: 1. 负责管理服务器维修时效,全流程运营备件供给、水位运营、现场维修等环节,推动复杂问题解决; 2. 负责建设与优化自维修工单平台与备件体系,实现自维修工单流与备件流的自动化与智能化; 3. 负责一线维修工程师的培训考核,完成技术分析,不断演进现场维修技能与工具,确保维修质量; 4. 负责全国站点的维修考核,设立运营指标,牵引各站点完成既定目标,达成项目结果; 5. 负责制定现场维修计划与策略,保证全国的推进落地。
1、负责辖区内机房自维修运维管理工作,结合IDC实际情况均衡考虑服务质量、效率、成本及安全,持续优化及改进以支撑部门的业务运营; 2、负责辖区内机房自维修的服务器维修整体质量,包括:人员能力、技术储备和备件质量,协助现场服务器维修达成维修SLA; 3、负责辖区内机房现场自维修进行日常自维修工单操作和流程指导,支撑不断扩大的自维修体量,确保相关指标满足业务整体需求; 4、针对不断扩充的自维修新机型,梳理基于现场实际情况的操作手册,同时对一线人员进行培训与认证,确保全国人员能力满足项目推进要求; 5、基于自维修项目,配合实现专业领域的边界拓展,包括但不限于专利、新技术、新产品等。
1、负责Aliyun.com业务运营的研发支撑工作,构建适合业务快速迭代的平台能力; 2、对业务场景保持敏锐,快速熟悉业务流程并理解业务痛点,对产品需求进行沟通、分析,完成技术方案的制定,核心系统及模块的设计与研发,驱动产品快速迭代; 3、参与建设通用、灵活、智能的业务支撑平台,支撑上层多场景的复杂业务,参与制定系统架构演进; 4、独立完成中小型项目的落地及管理工作,确保项目进度和质量,团队内外的沟通协作,包括业务沟通,技术合作,项目及人员管理等,推动组织高效运作; 5、能够在团队中完成code review的任务,确保相关代码的有效性和正确性,并能够通过code review提供相关编码、性能以及稳定性的建议。