蚂蚁金服网商银行-基础设施与系统安全专家/架构师-信息安全
任职要求
1.落地或实践过虚拟化/容器/操作系统等安全解决方案,熟悉常见系统安全防护机制,如Seccomp、SELinux、AppArmor等; 2.对虚拟化/容器/操作系统安全风险有深入研究,熟悉常见漏洞缓解机制如ASLR、DEP、SSP、PAN、PXN、CFI等; 3.熟悉云平台基础设施层的安全风险防护方案,如Kubernetes安全加固、微隔离、零信任、镜像扫描等,熟悉Falco、Istio、Clair、Kyverno等业界常用方案的原理; 4.具备一定的c/c++/go/rust等系统底层系统安全研发能力; 5.熟悉常见二进制逆向工具(IDA/windbg)等,有系统安全相关CVE漏洞挖掘经验者优先; 6.有落地可信执行和远程证明经验者优先,如SGX、SEV等。
工作职责
1.负责设计网商银行系统安全架构方案,包含底层硬件、系统内核、容器、应用的完整可信启动和可信运行的纵深防御体系; 2.主导网商银行云平台基础设施安全风险研究、评估、治理、防御方案设计与落地; 3.跟踪和研究业界最新系统安全领域技术和趋势,持续提升网商银行基础设施安全水位;

职位概述 我们正在寻找充满热情、学习能力强、对云计算和网络安全有浓厚兴趣的应届毕业生加入我们的团队。作为云/云安全运维工程师(应届生),你将从基础开始,在资深工程师的指导下,参与公司云平台(如 AWS, Azure, 阿里云, 腾讯云等)的日常运维、监控、基础架构部署以及初步的安全防护工作。这是一个快速学习和成长的平台,你将接触到业界领先的技术实践,为构建稳定、高效、安全的云环境贡献力量。 核心职责 (应届生培养方向) 1.云平台基础运维: o协助进行云资源(虚拟机、存储、网络、数据库等)的日常监控、状态检查与基础故障排查。 o学习并执行云资源的部署、配置、备份与恢复等基础操作(在指导下)。 o参与云环境成本的基础监控和优化建议。 2.云安全初步实践: o协助监控云平台安全日志和告警,识别潜在的安全风险或异常活动。 o学习和应用基础的安全组/防火墙规则、访问控制策略(IAM/RBAC)配置。 o参与漏洞扫描结果的初步分析和跟踪。 o学习并协助实施基础的安全合规性检查。 3.自动化与效率提升: o学习使用脚本语言(如 Python, Shell)或基础设施即代码工具(如 Terraform, Ansible)进行简单自动化任务的编写与执行。 o参与运维流程文档的编写和维护。 4.协作与学习: o积极向导师和团队成员学习,快速掌握云平台和云安全的核心知识与运维技能。 o参与团队的技术分享与讨论,提出改进建议。 o响应内部用户的基础技术支持请求。
1.依据年度审计计划,独立执行IT系统、数据安全、业务流程等专项审计,识别潜在风险与内控缺陷,提出可落地的改进建议,并跟踪整改落实情况; 2.针对IT基础设施(如网络架构、云平台、数据库等)开展风险评估,确保其符合公司政策和行业规范; 3.执行IT合规审计,评估公司IT政策、流程与外部法规(如SOX、网络安全法)的符合性,协助完善内控体系; 4.结合业务风险场景(如交易欺诈、数据泄露),统筹推动审计系统部署风险监控模型的搭建工作,定期输出风险报告并推动问题闭环; 5.维护审计分析工具与脚本,提升审计效率(如自动化日志分析、异常交易检测); 6.探索审计技术创新(如AI辅助审计工具),推动数字化转型。
职位概述: 我们正在寻找一位对系统稳定性和高可用性有着极致追求的高级运维工程师。您将成为我们电商及资讯平台基础设施的“守护者”,核心职责是确保生产环境7x24小时高可用,并高效管理从故障发现到恢复的全生命周期。您需要具备深厚的技术功底、冷静的应急心态和强大的复盘能力,通过自动化、流程化和系统化的方法,不断提升我们系统的韧性与可观测性,为亿万用户的顺畅体验保驾护航。 核心职责: 1. 系统高可用性保障: o 负责公司核心业务(电商、资讯)生产环境及基础设施(服务器、网络、数据库、中间件等)的稳定运行,确保服务SLA达到或超过既定目标(如99.99%)。 o 设计、实施和维护高可用和容灾架构,包括同城双活、异地灾备等方案的落地与演练。 2. 监控与应急响应: o 主导建设和优化集中式监控、日志分析与告警系统(如Prometheus/Grafana, ELK, Zabbix, Datadog等),确保能提前预警、快速发现问题。 o 作为主要事故处理指挥官(Incident Commander),负责7x24小时应急响应,领导并协调相关团队对线上事故进行快速定位、止损和恢复,最大限度降低影响。 3. 事故全生命周期管理: o 严格遵循ITIL等最佳实践,管理事故(Incident)和处理工单(Ticket)。 o 主导重大事故复盘(Post-mortem),编写详尽的复盘报告,深入分析根因,并推动落实改进措施(如代码修复、流程优化、架构调整等),避免同类问题重复发生。 4. 运维自动化与效率提升: o 通过编写脚本(Shell/Python/Go等)和利用自动化工具(Ansible/Terraform等),自动化日常运维操作和故障处理流程,提升效率,减少人为失误。 o 践行SRE(Site Reliability Engineering)理念,通过代码管理基础设施(IaC)。 5. 容量规划与性能优化: o 定期进行系统容量评估和规划,确保系统有能力应对业务增长和突发流量(如大促活动)。 o 分析系统性能瓶颈,协同开发团队进行调优,提升系统效率和资源利用率。 6. 系统组件的安全升级及维护: o 常规维护能力:具备使用安全扫描工具进行安全漏洞扫描额能力。 能全程跟进系统组件安全管理,做好版本监控、漏洞扫描与风险评估,按计划升级部署补丁、更新配置,快速应对突发安全事件,降低业务受影响程度。 o 借助工具强化能力:熟练使用安全卫士等工具,将其融入维护流程。实现自动化漏洞检测与修复建议输出,实时监控异常与潜在威胁并预警阻断,利用日志分析优化安全策略,构建闭环安全管理体系。
1、负责公司全球网络架构的规划设计、部署实施和维护优化,保障网络的高可用性、高性能和高安全性。 2、负责公司网络整体运营保障,网络安全防护 ,网络性能监控及网络故障处理。 3、负责公司IT预算管理,IT设备的选型,进行公司网络设备、网络架构的标准化修订工作,参与全球供应商的商务谈判,包括全球运营商管理,供应商等商务资质和流程的推进。 4、负责和指导开发自动化运维工具,不断研发与探索运维自动化及各类创新途径,缩短运维响应时间,减低运维成本。 5、赋能公司其他部门,提供网络技术支持和建议,助力业务系统的开发与部署。 6、持续跟踪技术和产业发展趋势,深刻洞察公司业务需求,构建满足业务需求和技术领先的IT基础设施。