小红书系统运维专家- IT
任职要求
1. 5年以上系统运维相关经历,有管理系统运维团队及NOC团队的经验; 2. 有丰富的基础设施管理经验,熟悉SRE相关基础理论与业务实践,熟悉Devops相关技术并具备相应经验,熟悉CI/CD相关知识; 3. 有丰富的公有云相关环境运维经验;同时具备私有云/本地计算环境管理经验优先; 4. 具备Vmware、kvm等常见虚拟化服务的架构设计,系统部署和运维经验,有大规模业务集群管理经验者优先; 5. 能熟练运用互联网常用开源基础组件(Nginx, Redis, Kafka等),熟悉Prometheus/Grafana/Zabbix等基础运维工具者优先; 6. 具备基本的业务运营能力,能够对日常业务进行流程和系统整合优先;
工作职责
岗位描述 规划、组织和管理IT相关系统的运维工作,参与IT体系中运维相关部分建设。满足操作工具化、管理自动化、服务平台化的长期建设需求。在包括运维自动化技术,监控技术,网络技术等方向,针对内部应用与基础设施服务,提供承上启下的专业支持服务。并通过与统一的后台服务管理团队的配合与衔接,来确保组织基础设施体系的日常稳定。 业务职责: 1. 组织,定义及实施IT相关业务的系统运维日常工作,设计并推进相关业务的技术迭代与业务演进。为公司内部应用提供体系化的统一应用运维和支持服务; 2. 建设业务系统运维相关能力,为IT业务相关的后台系统提供持续的高可用性服务与自动化业务管理工具; 3. 建设日常服务相关的快速响应能力,对相关业务团队提供快速响应业务需求的工具,服务及相关制度建设; 4. 在系统故障管理场景中,能作为 NOC 中的关键节点承担系统故障管理职责;
1、负责IT基础架构运维体系的建设和优化改进; 2、负责邮件系统、域控系统、办公电话系统、呼叫中心系统等运维管理相关工作,确保IT办公系统安全可靠稳定运行; 3、完成上级领导交给的其他相关工作。
1、负责阿里云专有云IAAS/大模型/PAAS/大数据/中间件等产品的运维专家支持、整体解决方案服务及优化建议,使客户的IT架构、性能等层面得到更好的优化与提升,制定相关的技术方案并予以支持落地。 2、负责对事件、故障的跟踪、剖析、总结与知识库沉淀,出具技术方案并推动相关产品团队解决落地,同时赋能一线运维团队自运维能力; 3、负责产品巡检工具与问题诊断分析工具开发,提升客户云平台的预警与异常自发现能力,提升用户的满意度。 4、直面AI智能运维、云原生Serverless架构、全业务容灾、系统自治等巅峰挑战,提供技术底盘及业务能力支持。 5、完成核心技术攻关,识别和解决潜在的技术风险
1、负责数据平台的交付实施,包括安装部署等工作; 2、负责处理私有化项目的告警、故障响应; 3、负责对客户进行相关培训、协助项目经理完成项目验收工作; 4、负责数据平台/数据仓库的维护工作、解决平台使用过程中客户碰到的问题。
1、熟练掌握Windows操作系统的安装配置,了解计算机硬件和驱动相关知识,进行系统镜像制作、批量装机部署服务器和工具(例如MDT、PXE)的运维任务。 2、具备桌面或系统运维领域的专业能力,能够利用原厂技术支持服务进行问题排查和根因分析。 3、能根据自身对业务(需求、特点、运营、技术)的了解,为操作系统管理相关的系统、工具、流程考虑并设计优化方案,提高操作系统服务和管理能力。 4、熟练使用Windows、macOS、Linux等操作系统下常用的脚本语言,具备开发自动化工具以简化桌面管理任务的能力。 5、在日常运维和运营工作中能主动发现和提炼问题,能结合业务特性给出匹配的问题解决方案,完成任务拆解,推进并交付项目。 6、具体良好的沟通和团队合作能力,能够为解决特定目标与其他团队协同工作。能沉淀出有效的工作方法和经验并形成知识文档,具备良好的写作基本功。