logo of antgroup

蚂蚁金服蚂蚁集团-高性能存储研发专家-上海/杭州

社招全职5年以上技术-基础平台地点:上海 | 杭州状态:招聘

任职要求


1. 存储引擎与系统深度
引擎设计:精通 LSM-Tree、B-Tree 等存储引擎原理,具备自研或深度定制高性能 KV 存储/持久化引擎的能力。
文件系统:深入理解 Linux I/O 子系统(ext4/xfs 等),熟悉 FUSE/SPDK blobfs,精通 io_uring、libaio 等异步 I/O 框架。
存储算法:精通 EC 纠删码(Reed-Solomon/LRC)、去重压缩、复杂负载均衡及分布式共识协议。
2. 高性能组件与网络
RDMA/网络:精通 Verbs API、libfabric 或 UCX,深入理解 QP/CQ 管理及 RDMA 硬件底层机制。
SPDK/DPDK:精通用户态驱动开发,熟悉 PMD、Mempool、Ring 缓冲区管理及 NVM…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位目标:
深度参与下一代超大规模分布式存储系统的架构设计与实现。利用 Kernel Bypass、软硬协同 及自研存储引擎等尖端技术,解决千亿级元数据挑战,构建微秒级低延迟、高吞吐的存储内核,支撑大模型训练及高性能计算场景。
核心职责:
1. 存储内核与引擎开发:负责 Blob 存储内核、持久化引擎及高性能元数据服务的设计与开发;针对 SSD/HDD 特性优化存储格式,实现小文件聚合、EC 编码及高效压缩。
2. 软硬协同与性能加速:利用 RDMA、SPDK、DPDK 等技术栈重构存储 I/O 链路,实现全链路零拷贝(Zero-copy)与微秒级端到端延迟。
3. 全栈性能调优:针对 AI 训练等高并发场景,进行 CPU 亲和性、NUMA 架构、网卡 Offload 及存储协议栈的深度调优,消除系统瓶颈。
4. 前沿技术落地:探索并落地高性能用户态文件系统、NVMe-oF 及计算存储一体化方案,确保存储系统在吞吐量与存储密度上的持续领先。
包括英文材料
Linux+
算法+
内核+
Perf+
eBPF+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 负责高性能并行文件系统中,新型存储介质、RDMA 网络相关性能分析工具开发和性能验证; 2. 结合存储硬件演进,负责并行文件系统的存储引擎在性能、成本、稳定性多维度的持续优化; 3. 与硬件团队合作进行软硬件结合设计,负责相关的存储软件设计和性能优化。

更新于 2025-11-23杭州|上海
logo of aliyun
社招技术类-开发

1、负责应对各种复杂业务场景的分布式文件系统的设计与研发,包含高可用高可靠高性能设计,文件系统核心 IO 栈的研发,参与数据路径和元数据路径的设计和研发。 2、负责分布式文件系统的稳定性工程,包括但不限于系统的可观测性、FaultTolerance、多租户 QoS系统研发。针对专属云网络隔离、专线带宽受限等特定风险,负责针对性的稳定性设计、SOP 和 演练。

更新于 2025-06-18杭州|上海
logo of xiaohongshu
社招3-5年数据引擎

1. 协同AI平台与算法团队,面向AI大模型训练和多样化数据处理场景,研发云原生文件系统和缓存加速系统,为AI业务提供极致的存储解决方案并推动在业务侧落地。 2. 应对小红书超大规模多模态应用挑战,攻克单集群百亿级元信息、Tbps级高吞吐等行业技术难题,保障AI业务的安全、稳定和高效运行。 3. 持续进行系统架构优化与技术迭代,结合AI负载特征,实现数据智能调度、数据预取和缓存管理,不断优化I/O路径,有效提升GPU等算力资源利用率。

更新于 2026-01-12北京|上海|杭州
logo of vivo
社招5年以上研发类

1、分析AI大模型等新型应用及系统IO访问workload,针对性设计高性能存储方案; 2、AI芯片并行计算下的带宽、存储效率的提升、新型存储介质的预研。

上海|杭州|南京