logo of aliyun

阿里云阿里云智能-存储索引服务研发专家-杭州/上海

社招全职5年以上云智能集团地点:杭州 | 上海状态:招聘

任职要求


1.精通 C++Golang,熟悉现代工程实践(C++11 及以上/Go 并发模型),理解内存模型、原子操作与锁的性能权衡。
2.熟悉分布式一致性与主流协议(Raft/Paxos),理解日志复制、快照、选主、租约/时钟漂移与脑裂防护。
3.理解经典存储引擎与索引结构,尤其是 LSM-tree(memtable/flush/compaction/写放大/读放大/空间放大)或 B+Tree,并能结合业务做权衡。
4.具备5年以上后端/系统基础研发经验,具备大规模多集群/同城双活/跨地域多活经验,有系统级性能优化经验优先。
5.工作态度严谨,具备良好的工程化能力、分析解决问题的能力及交付意识。

工作职责


1.负责存储索引中台的核心功能设计与研发,包括但不限于:路由/调度、分片管理(split/merge)、负载均衡与容灾切换。
2.构建多集群/联邦化管控:统一命名/注册发现、跨集群路由、在线再均衡与无感迁移。
3.持续性能剖析与优化(perf/eBPF/火焰图),在真实流量与压测环境下定位瓶颈、落地优化方案。
4.完善系统可观测性和运维能力、混沌演练、容量与变更发布策略,保障高可用与可回滚。
5.参与 CPFS 问题排查与稳定性治理,沉淀工具与最佳实践。
包括英文材料
C+++
Go+
Raft+
Paxos+
B+树+
相关职位

logo of antgroup
社招5年以上技术-基础平台

⁃ 解决千亿级元数据索引效率的问题,支撑海量文件的查询访问效率以及元数据扩展性问题,提供性能卓越扩展良好的元数据服务。 ⁃ 高效的blob存储格式,编写高质量、可扩展、高可用、性能卓越的存储底层核心模块,对模块质量负责。 ⁃ 负责性能IO链路,对小文件聚合、大文件切片、EC编码等核心功能负责。 ⁃ 基于业界主流的AI训练加速方案,打造符合蚂蚁特点的高性能AI存储/缓存产品,为大模型、海量多模态数据的高并发训练提供存储底座,为AI算力持续增长提供基础设施侧保障。 ⁃ 负责存储产品的长期技术演进及稳定性保障,对上层业务效果负责。

更新于 2025-09-28
logo of kuaishou
社招D7195

1、打造行业领先的数据湖服务,提供高效、极简的EB级数据存储与处理能力。推进快手数据体系的全面的湖仓化; 2、建设向量化执行引擎,结合微体系结构特性,持续不断优化引擎的执行性能; 3、设计与研发数据自动化生产能力,持续降低数据生产成本; 4、跟进学术界,工业界成熟的经验与技术,规划与推进快手数据体系的不断演进与迭代。

更新于 2025-03-07
logo of bytedance
社招2年以上A196935

1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标; 2、负责设计和实现面向面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 3、负责设计和实现面向多模态内容理解和检索元数据管理服务。

更新于 2025-05-12
logo of xiaohongshu
社招基础后端

1、产品解决方案设计:深入理解公司业务需求,结合 Redis、RedKV、MySQL、TiDB、RedTao、ROS 等多种存储数据库技术特点,主导设计高可用、高性能、可扩展的存储数据库产品解决方案,推动业务与技术深度融合。 2、平台研发与优化:牵头存储数据库运维提效工作,推动实现存储数据库资源自动化部署、智能监控、故障自愈等功能,提升存储数据库运维效率与服务质量,助力团队从传统运维向平台化运营转型。 3、横向项目落地:作为项目负责人,统筹协调跨部门资源,制定项目计划与技术方案,确保重大横向项目按时高质量完成,推动公司存储数据库技术体系升级与创新。 4、技术研究与创新:跟踪存储数据库领域前沿技术动态,探索新技术在公司业务场景的应用可行性,主导技术预研与 POC 验证,为公司技术发展提供前瞻性建议。 5、团队协作与知识共享:与业务部门、开发团队紧密沟通协作,提供专业的技术支持与咨询服务;组织内部技术培训与分享,提升团队整体技术水平。