小红书高可用架构师-基础技术
任职要求
1、全日制统招本科及以上学历,4年及以上计算机相关工作经验,在技术风险领域有经验者优先; 2、对服务治理、混沌工程、可观测性、高可用平台、云原生发布等系统有深刻的理解; 3、有大型复杂系统(搜索、推荐、电商等系统)的工程开发经验,并…
工作职责
1、夯实并迭代现有小红书的高可用架构设计(异地多活、多层容灾架构、服务自治等),通过技术发现破坏高可用架构设计的业务,并提供高可用相关平台能力进行高效改进; 2、理解业务架构,运用基础技术体系基建能力,设计面向未来小红书的发展的业务高可用架构,并在公司核心场景实施落地; 3、从稳定性、效率、成本角度,为业务提供专业的高可用架构技术顾问和技术保障支持;
1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。
1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。
1、负责火山引擎云原生容器平台产品的稳定性保障,通过平台建设/架构优化/组织提升等手段,不断提升云产品系统稳定性; 2、负责容器平台和大规模容器集群的稳定性保障,完成可靠性分析与优化;深入分析业务架构和系统运行时,持续识别稳定性薄弱环节,负责技术难点的攻坚,提升系统核心链路的整体稳定性; 3、参与火山引擎云原生容器平台产品的运维管控平台规划建设,设计实现相关自动化运维、分析诊断和保障体系,打造面向多地域超大规模集群的自动化运维和管控体系。
岗位定位:负责企业级IT基础架构规划、终端平台治理、运维开发体系建设及团队管理,统筹终端全生命周期管理、核心应用高可用架构与安全合规落地,支撑全球化业务稳定运行。 一、 1. 团队管理与组织建设 负责运维开发、终端管理团队日常管理、工作统筹、目标制定及绩效落地,搭建高效协作与交付体系。 主导团队人才梯队建设、技能培养与专业赋能,规划技术成长方向,提升团队整体运维开发与终端架构治理能力。 制定团队SOP与运维规范,推动团队从被动响应向主动规划、架构引领转型。 2. IT基础架构与终端平台架构规划 负责企业级终端与IT基础架构整体规划、设计及演进落地,制定Windows/Mac终端管理、Intune/MDM等平台长期架构蓝图。 主导职场&仓储终端架构迁移、升级与改造项目(如存量终端接入Intune、Win10/Win11 LTSC过渡),保障全球终端架构统一、稳定、可扩展。 统筹终端全生命周期管理体系建设,优化装机、部署、运维、补丁、淘汰全流程架构。 3. 运维开发与自动化体系建设 牵头运维开发与自动化平台规划,主导运维提效工具、脚本体系及可视化监控平台的设计与研发落地。 推动AI技术在运维开发、数据分析、终端健康预警中的应用,实现运维智能化升级。 熟练运用Golang/Python等技术栈,主导核心运维工具与平台的架构设计、开发及封装。 4. 核心应用系统高可用与容灾架构 负责内网核心协同应用(群晖NAS、可道云等)高可用架构规划、容器化部署及持续优化,治理Docker、Redis等基础组件架构。 制定并统筹应急容灾与故障预案,主导线上故障排查、根因分析及架构调优,保障核心应用7×24小时稳定运行。 5. 安全合规与全球终端管控落地 统筹IT安全合规架构落地,协同安全、法务部门完成软件版本收敛、违规软件管控及Entra ID/Intune合规策略优化。 负责BYOD设备合规管控及终端安全策略制定、落地,规避安全风险,满足全球化合规要求。 6. 跨部门协同与项目统筹 对接上下游及跨部门团队(安全、网络、海外IT等),对齐需求、统筹进度、协调资源解决关键问题。 主导重大IT架构项目的方案评审、落地推进及效果验收,确保架构方案贴合业务需求。 二、