
智能互联诚云科技-高级运维工程师-一朵云
任职要求
1、拥有2年以上大型云服务提供商(如阿里云、腾讯云、AWS、Azure等)运维或技术支持相关工作经验,具备大规模分布式系统运维实战背景; 2、熟练掌握主流云产品技术栈,精通ECS、SLB、VPC、RDS、Redis、消息中间件等云组件的深度配置、性能调优与故障排查; 3、具备运维工具开发能力,能使用Python/Shell/Go等语言开发自动化运维脚本或平台,提升运维效率与标准化水平; 4、拥有出色的集群调优与Troubleshooting能力,能够独立分析和解决复杂技术问题,具备完整的问…
工作职责
1. 负责企业级云平台核心系统的日常运维管理,保障平台7×24小时高可用性与稳定运行。 2. 主导云平台的版本升级、补丁管理、变更实施及回滚方案设计,确保变更过程安全可控。 3. 开展系统容量规划与性能优化,预测资源需求,支撑业务持续增长与弹性扩展。 4. 攻坚解决云平台重大疑难故障和技术问题,持续提升系统稳定性和服务可靠性。 5. 深度参与云平台整体安全体系的规划与建设,识别各业务场景下的潜在安全风险。 6. 设计并实施安全边界策略、访问控制机制和最小权限模型,强化系统安全防护能力。 7. 构建主动式安全防御体系,涵盖漏洞管理、入侵检测、威胁情报与安全审计等关键环节。 8. 通过自主研发或集成安全工具链,实现数据安全、访问行为、异常操作的自动化监控与响应。 9. 在重大故障应急响应、安全事件处置及客户关键活动护航中担任技术主导角色。 10. 高效组织协调内外部技术资源,快速定位问题并推动闭环处理,保障业务连续性与客户满意度。
1. 负责企业级云平台核心系统的日常运维管理,保障平台7×24小时高可用性与稳定运行。 2. 主导云平台的版本升级、补丁管理、变更实施及回滚方案设计,确保变更过程安全可控。 3. 开展系统容量规划与性能优化,预测资源需求,支撑业务持续增长与弹性扩展。 4. 攻坚解决云平台重大疑难故障和技术问题,持续提升系统稳定性和服务可靠性。 5. 深度参与云平台整体安全体系的规划与建设,识别各业务场景下的潜在安全风险。 6. 设计并实施安全边界策略、访问控制机制和最小权限模型,强化系统安全防护能力。 7. 构建主动式安全防御体系,涵盖漏洞管理、入侵检测、威胁情报与安全审计等关键环节。 8. 通过自主研发或集成安全工具链,实现数据安全、访问行为、异常操作的自动化监控与响应。 9. 在重大故障应急响应、安全事件处置及客户关键活动护航中担任技术主导角色。 10. 高效组织协调内外部技术资源,快速定位问题并推动闭环处理,保障业务连续性与客户满意度。
1. 负责政务云安全运营工作,确保政务云平台安全稳定运行,对平台侧安全结果负责; 2. 负责政务云平台的安全策略制定与实施,确保政务数据的安全性、完整性和可用性; 3. 负责政务云平台网络及应用安全事件的风险预警、溯源、协同、跟踪、改进优化及事后评估; 4. 负责安全应急响应流程的设计与优化,在发生安全事件时能够快速响应并采取有效措施消除风险; 5. 负责应用安全管控和审计体系建设,包括应用安全产品规划立项、产品部署、使用改进、策略优化等,也包括与周边云产品配合达到行之有效的管控和审计效果; 6. 负责政务云平台及应用相关的漏洞扫描、安全渗透、黑白盒测试,并协助跟进风险闭环; 7. 负责团队内部安全体系建设与运营,提升团队整体安全意识和技术水平。
负责运营管理全国服务器自维修,为现场提供深度技术支持,推动服务器维修优化提效: 1. 负责管理服务器维修时效,全流程运营备件供给、水位运营、现场维修等环节,推动复杂问题解决; 2. 负责建设与优化自维修工单平台与备件体系,实现自维修工单流与备件流的自动化与智能化; 3. 负责一线维修工程师的培训考核,完成技术分析,不断演进现场维修技能与工具,确保维修质量; 4. 负责全国站点的维修考核,设立运营指标,牵引各站点完成既定目标,达成项目结果; 5. 负责制定现场维修计划与策略,保证全国的推进落地。