logo of aliyun

阿里云阿里云智能-智算存储技术开发专家-AI领域-北京/杭州/上海

社招全职5年以上云智能集团地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 精通GolangC++, 在多线程等方面有丰富经验;
2. 对分布式系统设计与实现有深刻理解,熟悉常见中间件,如消息队列等;
3. 对存储系统,包括文件系统,对象存储,分布式KV等有深刻理解;
4. 具备存储,灾备或者云平台开发经验,有cache/file/block/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


智算存储技术开发专家将负责开发阿里云智算存储的数据的备份,容灾,同步,分层,治理子系统的研发,日常工作包括但不限于:
1. 设计和开发针对智算数据的大规模分布式数据保护与管理系统,包括但不限于数据重删,压缩,存储,复制,归档,分析功能,同时对系统的监控和运维能力负责,保证系统安全性和可靠性;
2. 测试,调优和运维大规模公共云服务和分布式存储系统;
3. 保持前瞻性, 随着业务复杂性, 负载增加, 运行管理复杂性的增加, 持续的推动系统设计的重构。
包括英文材料
Go+
C+++
多线程+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 负责阿里云容器云原生AI和大数据产品的架构设计和开发工作 2. 负责容器产品调度、管理大规模GPU/NPU/RDMA等异构资源集群的效率、性能和稳定性的持续优化 3. 负责基于Kubernetes容器构建面向AI/大模型训练和推理,大规模数据处理和工作流等场景的基础设施产品和解决方案 4. 负责云原生AI领域新技术和新方向的预研和落地,及相关开源能力建设

更新于 2025-11-26北京|杭州
logo of aliyun
社招3年以上技术类-质量保证

构建面向智能计算时代的下一代AI质量保障体系,驱动专有云智算、大模型等核心AI产品的卓越质量交付,同时通过AI技术重塑软件测试范式,打造智能化、前瞻性的测试基础设施: 1、 负责专有云智算平台(含GPU资源调度、高性能存储/网络组件)、大模型服务产品的全链路质量体系建设 2、同时能够将AI技术深度融入软件测试全流程,通过AI技术驱动测试效率提升、质量优化和流程变革 3、主导AI测试工具研发、智能化测试体系建设,并为团队提供AI技术在测试领域的前沿解决方案。

更新于 2025-06-13北京|杭州
logo of aliyun
社招5年以上技术类-开发

阿里云专有云是面向政企行业客户的全栈云平台,为企业级客户(政府、金融、部委、央企等行业)提供产品和服务。该岗位主要负责专有云智算平台架构规划、系统设计及核心技术研发。核心职责包括: 1、主导智算平台的全栈架构设计。针对不同平台芯片/不同集群规模做整体方案设计,满足千卡/万卡集群高并发、低延迟、弹性可扩展等需求。 2、性能及稳定性优化,提升集群运行效率,不断提升技术竞争力。 3、跟踪前沿技术趋势,推动新技术落地应用。参与行业标准制定。

更新于 2025-05-22成都|北京|深圳
logo of aliyun
社招8年以上技术类-开发

1、技术洞察和问题定义 •洞察网络技术发展方向,熟悉和定义技术标准以及前沿进展,跟踪关键竞对的技术和方法。 •结合产品现状定义网络问题,理解业务目标并分解到网络技术待解决问题中。 2、架构规划 •对业务的网络诉求进行架构抽象,建立业务长期发展的网络架构模型和规划。 •制定负责领域的网络架构规划和技术路线图,确定系统目标和方向,考虑关键技术选型、部署架构等多方面因素,确保网络架构的稳定高质量演进。 3、架构设计 •设计网络架构方案,包括规模能力、架构互联、路由、高可靠等。 •拆解关键设计目标为架构系统设计方案,全面评估技术选型、成本、稳定性、部署复杂度等多方面进行架构详细设计。 4、架构落地 • 详细设计架构落地的依赖,并设计和推动各组件和团队进行设计开发,以支撑架构落地。 • 设计测试方案,针对架构设计的关键feature和组件进行全面测试评估,确保技术可行性、性能、稳定性等满足设计预期。 • 输出架构详细设计LLD文档和架构测试文档,向运营团队输出架构运维指导。 5、技术沉淀和赋能 •团队技术架构分享、技术文档和架构规范沉淀、竞对技术调研和分析、学习引入新的网络技术,学习并分享负责业务方向的业务架构,尤其成为业务对网络部分的专家,形成文档沉淀。

更新于 2025-06-07北京|杭州