logo of aliyun

阿里云阿里云智能-服务器软硬件结合研发专家-杭州/深圳

社招全职5年以上云智能集团地点:深圳 | 杭州状态:招聘

任职要求


1. 电子、计算机、自动化相关专业;
2. 精通C/C++语言编程,熟悉Linux体系及实现原理(设备驱动、I/O系统、网络系统等),有kernel或用户态驱动开发经验;
3. 熟悉各种网络协议,网络基础知识,熟悉TCP/IP原理及实现,熟悉DPDK等;
4. 熟悉RDMA高性能网络协议在智能网卡上的实现与优化;
5. 具有良好的沟通能力,热爱技术,主动学习,能够快速掌握新技术;

掌握以下技能优先:
1. 熟悉掌握RDMA RoCE v2协议工作原理、问题定位方法,性能调优和编程实践;
2. 对RoCE v2驱动有实际开发或调优经验,对线上各类网络问题有丰富的问题定位经验;
3. 熟悉智能网卡软硬件结合性能优化技术,有实操经验优先;
4. 熟悉主流的RDMA智能网卡的特性和设计优先,包括不限于mellanox、broadcom等。

工作职责


1. 负责智能网卡的网卡驱动和RDMA驱动开发和实现;
2. 负责智能网卡在AI智算,存储等领域软硬件结合优化,创新研究;
3. 通过智能网卡的软硬件创新与优化,包括高性能网络协议的硬件卸载优化,帮助云产品基础设施持续提升技术竞争力。
包括英文材料
C+
C+++
Linux+
内核+
TCP/IP+
性能调优+
相关职位

logo of aliyun
社招5年以上技术类-开发

1. 依据公共云统一架构、OpenAPI规范、软件技术栈以及交付运维体系,负责专属云产品的研发与交付。深度参与灵骏裸金属服务器及EGS云计算服务器的研发流程,包括硬件架构预研、方案设计、软硬件结合的系统优化、线上服务质量保证以及提供专家技术支持等关键环节,确保产品从研发到运维的全生命周期高效管理。 2. 跟踪并把握GPU架构设计的发展趋势,探索前沿的GPU架构设计技术。联合高性能网络团队共同设计网络互联架构,针对分布式训练和推理业务场景,在软硬件协同及高性能网络方向上寻找性能优化的新途径,构建阿里云加速计算云服务器的核心竞争力。 3. 研发并持续改进系统的稳定性和安全性,确保平台的安全可靠运行,并不断提升对外服务质量标准。

更新于 2025-06-18
logo of aliyun
社招5年以上云智能集团

1. 负责FPGA/芯片产品的架构和系统方案设计,定义软硬件接口和FPGA逻辑架构, 完成逻辑设计和开发、测试、上线、运维等全生命周期的研发工作; 2. 负责相关FPGA/芯片的性能优化和稳定性保障,持续提升网卡互连的性能和稳定性,确保系统安全、稳定、高效运行; 3. 参与网卡互连等新技术预研和规划,跟踪业务需求和行业技术变化,进行产品规划和FPGA架构演进;包括下一代虚拟网络,软硬结合技术,高性能传输协议,AI Scale UP和Scale Out网络等。

更新于 2025-09-03
logo of xiaohongshu
社招后端开发

1、构建及维护操作系统基础环境,负责线上服务器操作系统底层基础模块的稳定运行。 2、优化操作系统、内核、服务器等运行环境,提升小红书整体业务性能。 3、结合软硬件及k8s调度技术,提供体系的解决方案,给上层应用带来稳定性的提升及成本的下降,包括但不限定于混部,超卖等技术。 4、负责构建实时、稳定的全链路跟踪系统,聚焦linux、服务器、交换机等基础设施的故障定界。

更新于 2025-09-13
logo of aliyun
社招5年以上云智能集团

1、设计并实现高效的AIGC工程/图像/视频处理软硬件一体化方案,参与媒体计算产品全生命周期开发。 2、负责系统性能调优,识别并解决关键瓶颈,提升稳定性与效率。 3、开发和维护底层驱动、基础软件及图像/视频SDK,确保硬件(ASIC/FPGA/GPU)与应用高效协同。

更新于 2025-09-08