
商汤系统运维工程师
任职要求
3年以上互联网运维经验,全日制本科及以上学历; 熟悉Linux系统及常见服务(Nginx/MySQL/Redis等); 掌握Shell/Python/Go等至少一种脚本语言,具备运维开发能力; 熟悉CI/CD流程,熟练使用Ansible/Jenkins/Docke…
工作职责
负责互联网产品的日常运维工作,保障系统稳定、高效运行; 参与自动化运维体系建设,优化部署、监控、告警等流程; 排查并解决线上故障,制定应急预案,提升系统可用性; 编写和维护运维脚本及工具,提升运维效率; 配合开发团队进行性能优化、容量规划及架构改进; 负责服务器、网络及中间件的配置管理和性能调优。
1、负责支撑网易集团旗下云音乐、Loft、支付等互联网产品的运维工作(涵盖操作系统运维、系统运维、容器运维等多个层面的工作),帮助业务持续提升产品稳定性; 2、负责相关运维工具和平台研发,通过工具和平台将运维能力赋能给外部其他团队,帮助其他团队提升效率; 3、关注业界前沿技术动态,通过新的运维技术和方法解决线上问题,提升团队运维质量; 4、持续优化运维操作和流程,保障海量用户的互联网产品稳定运行。
1、负责输出会议室IT设备的标准解决方案,包括无线投屏、商显、音视频设备选型和系统运维,持续提升用户入会体验 2、负责对文印系统、设备的运维,包括文印设备的上下架、报修、维保、抄数、巡检、系统预警处理等,保障设备可用性 3、负责对PC机房的建设和运维,包括机房用电设计评估、物资选型、网络需求对接,确保机房建设成本的合理性和稳定性 4、负责对IT弱电机房服务器系统安装、上下架、基本故障处理、盘点,确保操作流程合规,保障服务器、存储、网络设备、UPS、精密空调等设备稳定运行 5、负责对IT电脑硬件选型提供专业意见,确保性能与成本的平衡 6、负责会议室设备资产管理、持续优化设备预警能力、推动资产自动化盘点落地 7、负责专项项目方案评估,落地实施及设备运维,使用利旧设备,为业务部门提供云算力软硬件服务,降低业务运营成本 8、对现有工作流程、制度、系统工具建立统一标准规范,运营最佳实践案例在内部复用
1、负责支撑整个部门的产品运维工作,包括Linux操作系统及基础服务如Nginx、Kvm、DNS、DHCP、ES等日常管理和维护; 2、负责排查处理linux下的各类故障告警,进行相关系统调优, 持续完善监控告警体系; 3、参与自动化运维工具和平台开发,提升自动化程度,减少人为操作风险;通过工具和平台将运维能力赋能给外部其他团队,提高整体效率; 4、负责业务产品的服务器系统层架构设计,实施和维护高可用性、高性能系统架构,确保服务稳定性,将可靠性作为系统设计的核心目标 5、与开发、网络等其他团队紧密协作,提供所需系统层面技术支持和解决方案; 6、持续优化运维操作和流程,建立和维护完善的技术文档,构建团队知识库,促进经验共享和知识传承; 7、关注业界前沿技术动态,通过新的运维技术和方法解决线上问题,提升团队运维质量。