logo of aliyun

阿里云阿里云智能-存储软硬件结合技术专家-北京

社招全职5年以上云智能集团地点:北京状态:招聘

任职要求


1. 5年以上存储领域的工作背景,熟悉存储软件和分布式系统的开发,具备存储软件/硬件开发和产品化经验;
2. 熟练使用C/C++/Python等编程语言中的一种及以上,具有相关的开发经验;
3. 熟悉Linux系统和工具,具有系统软件调优经验优先;
4.…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 深入理解块存储、分布式存储的原理、技术架构,负责从业务视角深刻理解并抽象业务及数据I/O特征,并结合高性能硬件能力,设计&开发软硬件协同的加速方案;
2. 负责服务器产品测试策略、测试方案,测试用例,测试工具的定义、开发以及优化,支撑项目产品高效交付;
3. 与各团队密切配合,推进服务器整机产品在块存储/数据库等场景的落地;
4. 跟踪行业趋势,分析业内先进的存储部件、加速方案,制定产品交付规格,给业务交付更具竞争力的产品。
包括英文材料
分布式系统+
C+
C+++
还有更多 •••
相关职位

logo of meituan
社招软硬件服务-Sa

1. 设计与开发基于LLM的智能体系统架构,实现复杂任务规划、工具调用、记忆存储等核心功能 2. 构建多智能体协作框架,探索Agent间的通信协议与协同决策机制 3. 集成外部工具API(搜索引擎/数据库/专业软件),扩展Agent能力边界 4. 优化Agent的实时交互能力,包括对话流畅性、任务分解准确性、异常处理鲁棒性 5. 开发Agent评估体系,设计自动化测试场景与量化评估指标 6. 研究Agent持续学习机制,实现长期记忆存储与经验复用

更新于 2025-04-17北京
logo of aliyun
社招8年以上技术类-开发

1、技术洞察和问题定义 •洞察网络技术发展方向,熟悉和定义技术标准以及前沿进展,跟踪关键竞对的技术和方法。 •结合产品现状定义网络问题,理解业务目标并分解到网络技术待解决问题中。 2、架构规划 •对业务的网络诉求进行架构抽象,建立业务长期发展的网络架构模型和规划。 •制定负责领域的网络架构规划和技术路线图,确定系统目标和方向,考虑关键技术选型、部署架构等多方面因素,确保网络架构的稳定高质量演进。 3、架构设计 •设计网络架构方案,包括规模能力、架构互联、路由、高可靠等。 •拆解关键设计目标为架构系统设计方案,全面评估技术选型、成本、稳定性、部署复杂度等多方面进行架构详细设计。 4、架构落地 • 详细设计架构落地的依赖,并设计和推动各组件和团队进行设计开发,以支撑架构落地。 • 设计测试方案,针对架构设计的关键feature和组件进行全面测试评估,确保技术可行性、性能、稳定性等满足设计预期。 • 输出架构详细设计LLD文档和架构测试文档,向运营团队输出架构运维指导。 5、技术沉淀和赋能 •团队技术架构分享、技术文档和架构规范沉淀、竞对技术调研和分析、学习引入新的网络技术,学习并分享负责业务方向的业务架构,尤其成为业务对网络部分的专家,形成文档沉淀。

更新于 2025-06-07北京|杭州
logo of xiaohongshu
社招3-5年引擎

【业务介绍】 作为公司统一的模型训练引擎团队,支撑公司内所有搜推广类业务的训练工程侧工作,包括模型训练、参数服务器、特征样本流水线等,通过引擎能力的持续建设结合多元异构算力为业务提供高效、灵活、稳定的搜广推模型服务。 为公司核心的搜广推业务提供关键的模型训练引擎支撑,解决超大规模稀疏特征训练的核心问题,不断挖掘异构硬件算力,为公司搜广推业务增长提供保障,并获得快速的成长与提升。 【岗位职责】 1、负责小红书搜广推业务线的机器学习训练框架的研发与迭代,核心支持公司所有相关业务场景; 2、深入参与分布式训练、自动并行化、参数服务器、特征样本流水线等系统底层功能的创新设计与优化,实现软硬件协同的极致训练效率; 3、跨团队合作,与公司算法部门深度协同,针对关键项目开展算法与系统的联合优化,推动解决实际业务挑战; 4、推动自动化扩展、智能资源调度、跨架构设备兼容(NV GPU、GPGPU、XPU等)、AI系统可观测性等先进技术在公司模型训练平台落地; 5、跟踪并推动AI系统领域的最新技术趋势(如生成式推荐、AI编译优化、RDMA/NCCL通信计算并发等),持续保持平台业界领先优势。

更新于 2025-11-11北京|上海
logo of xiaohongshu
社招后端开发

1、构建及维护操作系统基础环境,负责线上服务器操作系统底层基础模块的稳定运行。 2、优化操作系统、内核、服务器等运行环境,提升小红书整体业务性能。 3、结合软硬件及k8s调度技术,提供体系的解决方案,给上层应用带来稳定性的提升及成本的下降,包括但不限定于混部,超卖等技术。 4、负责构建实时、稳定的全链路跟踪系统,聚焦linux、服务器、交换机等基础设施的故障定界。

更新于 2025-09-13北京|上海|杭州