logo of xiaohongshu

小红书分布式存储研发工程师/专家-存储&数据库部

社招全职1年以上基础后端地点:北京 | 上海 | 杭州状态:招聘

任职要求


-计算机相关专业本科及以上学历,1年以上大规模分布式存储或文件系统研发经验;精通 C/C++GolangRust 中的一门或多门语言,精通AI Coding者优先
-具备扎实的操作系统、数据结构算法基础;深入理解 Linux 内核 I/O 机制、文件系统底层原理及高并发控制,熟悉 RoCE / InfiniBand 等高性能网络栈,有 RDMA 编程或硬件卸载(Offload)实战经验者优先
-有丰富…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责公司新一代统一分布式存储(对象+文件)的核心架构设计与研发。面向 EB 级海量数据,打造百Tbps 级超高带宽与微秒级极低延迟的高可用存储服务,全面支撑AGI、社交、推荐、搜索、电商、广告等核心业务场景
-深入剖析大模型训练与推理的 I/O 特征,攻克集群计算中的 I/O带宽和延迟瓶颈与百亿文件等难题,保障采集、清洗、训练、发布等全流程在统一存储上无缝运行,彻底打破“存储墙”,极致提升 GPU 算力利用率。
-紧跟下一代硬件架构趋势,结合 PCIe 5.0 高带宽特性与QLC、FDP等新型固态存储技术进行底层 I/O 栈重构;探索 CXL 内存/存储池化、DPU/SmartNIC 硬件卸载及 GPUDirect Storage 技术,实现极致的内核旁路(Bypass Kernel)与端到端零拷贝优化,不断突破单机与集群的性能极限。
包括英文材料
C+
C+++
Go+
算法+
数据结构+
学历+
Rust+
还有更多 •••
相关职位

logo of aliyun
社招8年以上技术类-开发

1、承担MaxCompute管控系统架构师角色,负责产品技术架构演进方向 2、面向全球不同客户设计合理的产品方案,梳理存储、计算、售卖、控制台、运维体系架构,确定技术方案选型 3、承担MaxCompute管控系统设计、研发、测试、发布与运维 4、与MaxCompute各研发团队+SRE中台团队+阿里云售卖平台配合,共同推进技术项目按要求落地

更新于 2025-04-02杭州
logo of eleme
社招3年以上技术类-开发

1、负责饿了么交易平台的技术研发工作,深入挖掘业务需求,独挡一面,包括需求分析、架构设计和代码实现; 2、将复杂业务抽象、总结沉淀为技术平台能力,对业务进行前瞻性判断,对现存或者未来系统进行宏观的深度思考,系统化通过技术解决业务问题; 3、持续优化系统架构,提高系统在高并发、大流量下的容灾容错能力,保证系统的高可用性(性能、安全、容量);同时应具备成本思维,实现最少成本解决业务问题; 4、对工程师技术文化身体力行,让团队成员在你的影响下取得成长,为团队引入创新技术、创新的解决方案,用创新思路解决问题。

更新于 2025-08-26上海
logo of bytedance
社招A92695A

团队介绍:基础架构数据库 CDI(Common Data Infra)团队支撑字节核心业务板块的数据基础设施建设,深度参与业务存储/数据架构的演进工作。团队负责面向 Base 领域的分布式数据库 FxDB 和向量数据库等产品的研发和迭代,深耕前沿数据库技术,助力业务提升核心技术品质。 1、负责向量索引构建、向量检索等核心算法的实现和性能优化; 2、负责高性能向量数据库的架构设计、功能迭代、以及产品化; 3、针对泛 AI 产品业务场景下的特定需求,提出解决方案并落地。

更新于 2024-07-30广州
logo of antgroup
社招3年以上技术-开发

蚂蚁ASystem致力于打造下一代AI基础软件,并基于下一代的AI基础软件寻找通用智能的新方法,追求智能上限。 1、负责训推一体存储的设计与开发,建设面向训推一体的显存扩展和高性能数据存储方案,服务蚂蚁内部的强化学习场景; 2、负责整体性能优化与架构升级,通过存算结合持续提升训练/推理效率; 3、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-09-03北京|杭州