阿里云阿里云智能-文件存储研发专家-北京/杭州
社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘
任职要求
1、5年以上分布式存储系统或并行文件系统架构和研发经验。有丰富的系统设计和架构经验,能够设计高性能、高可用的存储架构方案。 2、深入理解并行文件系统的工作原理和架构,熟悉常见的并行文件系统(如Lustre、GPFS、GlusterFS等)…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责并行文件系统的架构设计,设计并实现高性能、可扩展的并行文件系统架构。参与关键模块的研发,主导高效的目录树架构和数据路径性能可扩展架构。 2、负责稳定性架构,系统在高性能的同时,具备面向失败的设计,建设稳定性工程能力,构建可观测系统,夯实稳定安全能力。
包括英文材料
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
高可用+
https://redis.io/blog/high-availability-architecture/
A high available architecture is when there are a number of different components, modules, or services that work together to maintain optimal performance, irrespective of peak-time loads.
https://www.ibm.com/think/topics/high-availability
High availability (HA) is a term that refers to a system’s ability to be accessible and reliable close to 100% of the time.
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
还有更多 •••
相关职位
社招3年以上技术-开发
蚂蚁ASystem致力于打造下一代AI基础软件,并基于下一代的AI基础软件寻找通用智能的新方法,追求智能上限。 1、负责训推一体存储的设计与开发,建设面向训推一体的显存扩展和高性能数据存储方案,服务蚂蚁内部的强化学习场景; 2、负责整体性能优化与架构升级,通过存算结合持续提升训练/推理效率; 3、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
更新于 2025-09-03北京|杭州
社招5年以上技术类-开发
1. 负责超大规模分布式块存储数据面系统架构、设计和研发工作,制定技术演进计划,保障技术竞争力和生产稳定性 2. 负责基于硬件基础设施进行软硬一体优化设计和调优,提供业界优秀的块存储性能 3. 针对公共云、非公共云等场景,进行块存储数据链路和分布式存储相关系统研发,确保稳定可靠高性能,和多场景下块存储能力输出的一致性和技术先进性
更新于 2025-04-15北京|杭州
社招5年以上云智能集团
1.构建盘古分布式文件系统的标准化输出能力,提高系统的自动化部署、运维能力; 2.梳理盘古分布式文件系统管控系统的依赖,降低对外部系统的依赖,建立运维管控系统回归测试能力; 3.重构盘古管控系统的数据层和逻辑层,确保系统在迭代更新的过程中始终保证兼容性和服务稳定; 4.对接阿里云安全体系和基础管控系统,确保系统能在多用户环境下安全稳定运行。
更新于 2025-09-11北京|杭州