logo of aliyun

阿里云阿里云智能-网络系统软件技术专家-杭州

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1. 计算机科学、软件工程等相关专业优先;5年以上Linux Coding经验;
2. 精通网络硬件(网卡或交换机芯片)原理,具备丰富高带宽交换芯片开发经验,如Broadcom、Barefoot等;
3. 熟悉大规模数据中心和骨干网架构和相关的网络协议,比如BGP、L3VPN等;
4. 熟悉L…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


你将在以下三个领域:
1. 大型分布式系统软件的高可用性设计开发,自动化故障分析定位能力建设;
2. 高带宽高性能交换路由转发平面的定义、研发、测试和创新;
3. 大规模分布式路由协议的研发、测试和创新。
从事以下工作:
1、技术方案设计
• 收集、识别、分析网络架构和运维侧需求,并确定技术方案的目标、范围和交付成果;
• 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等。
2、技术实现
• 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现;
• 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等;
• 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署;
• 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等。
3、稳定性和性能优化
• 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠;
• 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。
4、技术预研
• 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。
5、技术规划
• 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
包括英文材料
Linux+
内核+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责推理网关核心能力设计和开发; ● 通过创新的流量调度算法减少推理成本;

更新于 2025-04-03北京|杭州|成都
logo of antgroup
社招3年以上技术类-开发

我们是蚂蚁集团网络技术团队,为蚂蚁集团全站提供通智一体、稳定高效的网络基础设施产品、平台和服务。 ● 负责集合通信库的设计和研发; ● 通过稳定性建设和通信优化提升大模型训练效率和减少推理成本;

更新于 2025-04-03北京|杭州|成都
logo of aliyun
社招5年以上技术类-开发

1、负责运维管控系统子模块设计和研发工作,如部署升级系统、根因分析系统、监控告警体系、故障自愈系统等。 2、负责可观测性平台系统的设计和研发工作,提升服务质量和系统的可观测能力。 3、制定交付标准和运维规范,通过自动化的方式,提升系统运行的效率及稳定性。

更新于 2025-04-15杭州|上海
logo of aliyun
社招8年以上云智能集团

1、技术方案设计 • 收集、识别、分析DCN, AI infra 需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 跟踪和了解新的DCN, AI infra 的发展趋势,参与UEC, SONiC等开源社区的工作, 并根据业务需要提供新的技术支持和建议, 让阿里的发展方向和业界的发展方向吻合。 5、技术规划 • 理解AI infra的战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-09-10杭州