蚂蚁金服蚂蚁集团-高级安全工程师/专家(风险管理方向)-杭州
任职要求
1、3年及以上的网络安全领域从业经验,对应用安全、主机/网络安全、运维安全、办公安全等领域或部分领域熟悉。
2、熟悉常见安全漏洞原理和漏洞复现方法,对SDL全周期的实践有一定经验,并具备安全风险评估能力。
3、熟悉ISO/IEC27001信息管理体系要求,拥有中大型企业实际落地经验…工作职责
1、负责蚂蚁集团网络安全制度、红线、规范、流程的维护、完善、宣贯、审计、运营; 2、负责蚂蚁集团网络安全风险的梳理、评估和治理,并贴合业务场景,推进风险规避或改进缓解措施的制定和落地。 3、完善蚂蚁集团员工安全培训体系,提升员工网络安全意识,并建立效果评价模型; 4、完善蚂蚁集团网络安全度量体系和指标模型,探索网络安全治理新模式。
职位概述: 作为蚂蚁集团园区消防安全中台,负责构建、实施全域园区/楼宇的消防安全管理规划和体系;规划、建设并运维智慧消防系统;监督和指导各园区消防安全运营执行;确保消防安全业务贴合业务实际并符合国家及地方消防法律法规,提升消防安全管理效能。 核心职责: 1、负责规划、建设并运维园区智慧消防系统 - 负责园区智慧消防系统的整体规划、方案设计和技术选型,确保系统架构先进性与扩展性; - 负责智慧消防系统平台的日常运维,包括系统巡检、故障诊断、设备维护及软硬件升级优化; - 负责智慧消防系统的数据分析,包括但不仅限于报警预警、设备状态、巡检记录等,通过数据分析驱动管理决策; 2、负责消防安全管理规划和体系建设 - 根据国家法律法规,制定并持续迭代消防安全管理制度、技术标准及操作流程,确保消防安全工作符合《消防法》《建筑设计防火规范》等法规要求; - 为新建/改造项目提供消防专业技术支持:参与图纸审核、技术选型、竣工验收及系统对接; 3、负责监督和指导各园区消防安全运营执行 - 负责组织开展系统性消防安全风险评估,识别重大隐患并制定治理方案; - 负责监督和指导各园区开展消控室值守、消防安全巡查等日常消防安全运营执行; - 负责统筹组织开展消防安全月、消防技能比武等消防安全活动; 4、负责消防生态关系建设和维护 - 负责开展和指导开展与各级消防监管机构的常态化对接和协调; - 负责协调和指导协调消防监管机构园区消防应急响应和问题解决; - 负责协调消防监管机构指导园区日常消防安全运营工作、消防安全月等特别指导和支持。

职位概述 我们正在寻找充满热情、学习能力强、对云计算和网络安全有浓厚兴趣的应届毕业生加入我们的团队。作为云/云安全运维工程师(应届生),你将从基础开始,在资深工程师的指导下,参与公司云平台(如 AWS, Azure, 阿里云, 腾讯云等)的日常运维、监控、基础架构部署以及初步的安全防护工作。这是一个快速学习和成长的平台,你将接触到业界领先的技术实践,为构建稳定、高效、安全的云环境贡献力量。 核心职责 (应届生培养方向) 1.云平台基础运维: o协助进行云资源(虚拟机、存储、网络、数据库等)的日常监控、状态检查与基础故障排查。 o学习并执行云资源的部署、配置、备份与恢复等基础操作(在指导下)。 o参与云环境成本的基础监控和优化建议。 2.云安全初步实践: o协助监控云平台安全日志和告警,识别潜在的安全风险或异常活动。 o学习和应用基础的安全组/防火墙规则、访问控制策略(IAM/RBAC)配置。 o参与漏洞扫描结果的初步分析和跟踪。 o学习并协助实施基础的安全合规性检查。 3.自动化与效率提升: o学习使用脚本语言(如 Python, Shell)或基础设施即代码工具(如 Terraform, Ansible)进行简单自动化任务的编写与执行。 o参与运维流程文档的编写和维护。 4.协作与学习: o积极向导师和团队成员学习,快速掌握云平台和云安全的核心知识与运维技能。 o参与团队的技术分享与讨论,提出改进建议。 o响应内部用户的基础技术支持请求。
职位概述: 我们正在寻找一位对系统稳定性和高可用性有着极致追求的高级运维工程师。您将成为我们电商及资讯平台基础设施的“守护者”,核心职责是确保生产环境7x24小时高可用,并高效管理从故障发现到恢复的全生命周期。您需要具备深厚的技术功底、冷静的应急心态和强大的复盘能力,通过自动化、流程化和系统化的方法,不断提升我们系统的韧性与可观测性,为亿万用户的顺畅体验保驾护航。 核心职责: 1. 系统高可用性保障: o 负责公司核心业务(电商、资讯)生产环境及基础设施(服务器、网络、数据库、中间件等)的稳定运行,确保服务SLA达到或超过既定目标(如99.99%)。 o 设计、实施和维护高可用和容灾架构,包括同城双活、异地灾备等方案的落地与演练。 2. 监控与应急响应: o 主导建设和优化集中式监控、日志分析与告警系统(如Prometheus/Grafana, ELK, Zabbix, Datadog等),确保能提前预警、快速发现问题。 o 作为主要事故处理指挥官(Incident Commander),负责7x24小时应急响应,领导并协调相关团队对线上事故进行快速定位、止损和恢复,最大限度降低影响。 3. 事故全生命周期管理: o 严格遵循ITIL等最佳实践,管理事故(Incident)和处理工单(Ticket)。 o 主导重大事故复盘(Post-mortem),编写详尽的复盘报告,深入分析根因,并推动落实改进措施(如代码修复、流程优化、架构调整等),避免同类问题重复发生。 4. 运维自动化与效率提升: o 通过编写脚本(Shell/Python/Go等)和利用自动化工具(Ansible/Terraform等),自动化日常运维操作和故障处理流程,提升效率,减少人为失误。 o 践行SRE(Site Reliability Engineering)理念,通过代码管理基础设施(IaC)。 5. 容量规划与性能优化: o 定期进行系统容量评估和规划,确保系统有能力应对业务增长和突发流量(如大促活动)。 o 分析系统性能瓶颈,协同开发团队进行调优,提升系统效率和资源利用率。 6. 系统组件的安全升级及维护: o 常规维护能力:具备使用安全扫描工具进行安全漏洞扫描额能力。 能全程跟进系统组件安全管理,做好版本监控、漏洞扫描与风险评估,按计划升级部署补丁、更新配置,快速应对突发安全事件,降低业务受影响程度。 o 借助工具强化能力:熟练使用安全卫士等工具,将其融入维护流程。实现自动化漏洞检测与修复建议输出,实时监控异常与潜在威胁并预警阻断,利用日志分析优化安全策略,构建闭环安全管理体系。
客户贴身技术服务 • 技术问题处置:持续关注并分析客户用云技术问题,通过对客户业务的深入理解协助客户完成技术案例的快速高效处置。 • 需求追踪:在各行业结合客户业务场景和云产品使用情况,对客户使用情况和需求进行正确分析,挖掘真实产品需求并协助产品持续优化。 稳定性支持与保障 • 应急保障:重大故障问题的应急处置,协助业务快速恢复,故障逃逸等保障工作 • 风险巡检:针对客户使用云产品,进行使用负载,业务容量,风险事件,变更通知等巡检 • 主动服务:结合客户云上业务,制定关键架构监控和告警方案,实现智能监控和预警,提升客户的业务效率和用户体验。 • 全链路评估:对客户业务全链路调用评估,结合业务调用的云上/云下一体化风险评估,关键链路使用建议和风险提醒 • 高可用演练:围绕架构高可用方向,配合客户进行极端场景的高可用演练,模拟故障场景,演练业务逃逸实施并参与总结 • 活动护航:客户重大业务高峰活动护航,包括活动业务架构梳理,前置产品风险巡检,性能压测,故障演练,驻场保障等 云上业务治理与优化 • 用云优化:对客户新产品选型、产品使用方式、支撑行业最佳实践方案,规避通用行业客户使用误区,提炼围绕客户的最佳用云实践方案 • 云上资源管理:协助客户进行云上资源管理,业务资源使用率分析、容量管理和弹性伸缩方案保障 • 卓越架构支持:围绕卓越架构目标,对安全合规、稳定性、成本优化、高效性能方案等全方面优化工作支撑 服务保障 • 服务管理:为客户在云上使用过程中制定合理的服务及交流渠道,提供线上,现场,多项目多部门关键人员的服务交流方案支持,确保关键事件及重点项目的进展信息有效性,推进项目进展顺利落地。 • 项目支持:在客户使用云产品期间根据需求提供多样化的技术保障专项,并结合云产品特性和客户使用情况制定对应技术方案执行路线,保障技术专项的有效交付。 • 满意度保障:为企业客户满意度负责,从问题快速解决到项目平稳交付,并持续提供有效的云上使用建议和稳定性保障方案整体提升客户用云满意度。