logo of aliyun

阿里云阿里云智能-高性能网络技术专家-北京

社招全职8年以上技术类-开发地点:北京状态:招聘

任职要求


• 8年以上工作经验,5年以上高性能网络方向工作经验
• 熟悉RDMA协议的细节,参与过高性能网络协议的设计和研发工作
• 参与过基于RDMA的通信库或网络系统的研发,并有实际落地部署的经验
• 熟悉RDMA或自定义高性能在生产网大规模部署时的常见问题
• 有拥塞控制算法研发经验或端到端性能分析和优化经验者优先
• 熟悉Nvidia DPU架构和有相关研发经验者优先
• 熟悉Nvidia RPDMA框架和有相关研发经验者优先
• 熟悉智能网卡RDMA引擎实现细节或网卡驱动者…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、技术方案设计
• 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果
• 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等
2、技术实现
• 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现
• 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等
• 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署
• 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等
3、稳定性和性能优化
• 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠
• 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能
4、技术预研
• 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。
5、技术规划
• 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
包括英文材料
算法+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 围绕 高性能、低延迟 的分布式存储系统,负责新机型及新型硬件技术选型与系统架构的设计适配,评估其对性能、可靠性、成本和运维的影响,输出硬件引入可行性方案。 2. 负责深度参与软硬件协同调优,结合自研分布式存储软件栈与底层硬件特性,在 CPU 性能热点调优、异构计算加速、端网一体 等层面进行联合优化,取得吞吐最大化、延迟SLA有保障的系统优化结果。 3. 负责构建并实施覆盖兼容性、稳定性与性能的多维度验证体系,针对不同CPU、存储介质、网络架构,开展大规模自动化测试与长期压力验证,确保硬件满足生产环境SLA要求。 4. 负责推动新硬件在生产环境的标准化导入与灰度上线验证,制定硬件准入规范、监控指标与故障应急机制,协同运维、SRE与供应链团队完成从灰度到规模化部署的过程。 5. 负责持续跟踪存储与服务器硬件前沿技术,开展预研验证与原型测试,为下一代存储架构演进提供技术储备与决策依据。

更新于 2025-11-20北京|杭州
logo of bytedance
社招A129532

1、负责云网络转发面及控制面架构和研发工作,包括软硬结合/虚拟化/SDN等网络技术; 2、负责云网络融合网关、主机网络等转发业务设计和开发; 3、负责VPC/EIP/4-7层负载均衡/NAT/VPN等产品设计与研发工作。

更新于 2024-02-21北京
logo of aliyun
社招8年以上云智能集团

1、负责面向海量终端多场景融合的云DNS系统的架构设计、核心代码开发与建设维护。 2、从自身系统稳定性基础上推进系统高并发、安全性等优化。 3、解决潜在系统技术风险,保障系统的安全、稳定、快速运行。 4、推进DNS云生态建设,包括但不限于DNS标准的创新与推广等。 1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果。 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现。 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等。 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署。 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等。 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠。 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-09-08北京|杭州
logo of aliyun
社招3年以上云智能集团

1. 负责大模型运行所需的XPU相关软硬件平台的适配和优化工作,解决适配和优化过程中的兼容性、系统性能、稳定性、高可用等方面的技术问题; 2. 为客户提供XPU相关软硬件平台交付方案设计和部署落地服务,聚焦算力资源评估、底层软件选型、训推环境搭建、训推性能优化、大模型评测等领域为客户提供最佳实践和落地能力; 3. 为客户提供XPU算力资源池相关的高性能网络技术选型、规划设计、交付部署和性能优化服务,解决XPU、整机、POD接入和组网过程中的控制与转发技术问题; 4. 为客户提供训练数据集构建、数据合成、模型后训练、模型效果评测等服务。

更新于 2025-12-01西安|成都|北京