蚂蚁金服蚂蚁集团-高性能存储研发专家-上海/杭州
社招全职5年以上技术-基础平台地点:上海 | 杭州状态:招聘
任职要求
1. 存储引擎与系统深度 引擎设计:精通 LSM-Tree、B-Tree 等存储引擎原理,具备自研或深度定制高性能 KV 存储/持久化引擎的能力。 文件系统:深入理解 Linux I/O 子系统(ext4/xfs 等),熟悉 FUSE/SPDK blobfs,精通 io_uring、libaio 等异步 I/O 框架。 存储算法:精通 EC 纠删码(Reed-Solomon/LRC)、去重压缩、复杂负载均衡及分布式共识协议。 2. 高性能组件与网络 RDMA/网络:精通 Verbs API、libfabric 或 UCX,深入理解 QP/CQ 管理及 RDMA 硬件底层机制。 SPDK/DPDK:精通用户态驱动开发,熟悉 PMD、Mempool、Ring 缓冲区管理及 NVM…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位目标: 深度参与下一代超大规模分布式存储系统的架构设计与实现。利用 Kernel Bypass、软硬协同 及自研存储引擎等尖端技术,解决千亿级元数据挑战,构建微秒级低延迟、高吞吐的存储内核,支撑大模型训练及高性能计算场景。 核心职责: 1. 存储内核与引擎开发:负责 Blob 存储内核、持久化引擎及高性能元数据服务的设计与开发;针对 SSD/HDD 特性优化存储格式,实现小文件聚合、EC 编码及高效压缩。 2. 软硬协同与性能加速:利用 RDMA、SPDK、DPDK 等技术栈重构存储 I/O 链路,实现全链路零拷贝(Zero-copy)与微秒级端到端延迟。 3. 全栈性能调优:针对 AI 训练等高并发场景,进行 CPU 亲和性、NUMA 架构、网卡 Offload 及存储协议栈的深度调优,消除系统瓶颈。 4. 前沿技术落地:探索并落地高性能用户态文件系统、NVMe-oF 及计算存储一体化方案,确保存储系统在吞吐量与存储密度上的持续领先。
包括英文材料
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
内核+
https://www.youtube.com/watch?v=C43VxGZ_ugU
I rummage around the Linux kernel source and try to understand what makes computers do what they do.
https://www.youtube.com/watch?v=HNIg3TXfdX8&list=PLrGN1Qi7t67V-9uXzj4VSQCffntfvn42v
Learn how to develop your very own kernel from scratch in this programming series!
https://www.youtube.com/watch?v=JDfo2Lc7iLU
Denshi goes over a simple explanation of what computer kernels are and how they work, alonside what makes the Linux kernel any special.
Perf+
https://perfwiki.github.io/main/
perf is powerful: it can instrument CPU performance counters, tracepoints, kprobes, and uprobes (dynamic tracing).
https://www.brendangregg.com/bpf-performance-tools-book.html
This book can help you get the most out of your systems and applications, helping you improve performance, reduce costs, and solve software issues.
[英文] perf Examples
https://www.brendangregg.com/perf.html
These are some examples of using the perf Linux profiler, which has also been called Performance Counters for Linux (PCL), Linux perf events (LPE), or perf_events.
https://www.youtube.com/watch?v=M6ldFtwWup0
eBPF+
https://ebpf.io/get-started/
eBPF is a revolutionary technology that can run sandboxed programs in the Linux kernel without changing kernel source code or loading a kernel module.
还有更多 •••
相关职位
社招5年以上云智能集团
1. 负责高性能并行文件系统中,新型存储介质、RDMA 网络相关性能分析工具开发和性能验证; 2. 结合存储硬件演进,负责并行文件系统的存储引擎在性能、成本、稳定性多维度的持续优化; 3. 与硬件团队合作进行软硬件结合设计,负责相关的存储软件设计和性能优化。
更新于 2025-11-23杭州|上海
社招技术类-开发
1、负责应对各种复杂业务场景的分布式文件系统的设计与研发,包含高可用高可靠高性能设计,文件系统核心 IO 栈的研发,参与数据路径和元数据路径的设计和研发。 2、负责分布式文件系统的稳定性工程,包括但不限于系统的可观测性、FaultTolerance、多租户 QoS系统研发。针对专属云网络隔离、专线带宽受限等特定风险,负责针对性的稳定性设计、SOP 和 演练。
更新于 2025-06-18杭州|上海
社招3-5年数据引擎
1. 协同AI平台与算法团队,面向AI大模型训练和多样化数据处理场景,研发云原生文件系统和缓存加速系统,为AI业务提供极致的存储解决方案并推动在业务侧落地。 2. 应对小红书超大规模多模态应用挑战,攻克单集群百亿级元信息、Tbps级高吞吐等行业技术难题,保障AI业务的安全、稳定和高效运行。 3. 持续进行系统架构优化与技术迭代,结合AI负载特征,实现数据智能调度、数据预取和缓存管理,不断优化I/O路径,有效提升GPU等算力资源利用率。
更新于 2026-01-12北京|上海|杭州