logo of aliyun

阿里云阿里云智能-云网络技术架构师-杭州

社招全职10年以上云智能集团地点:杭州状态:招聘

任职要求


● 背景和经验
  1. 计算机科学、网络工程或相关专业,10年以上云网络架构及开发经验。
  2. 研发设计的架构和产品有规模应用,具备架构设计的成功经验。
  3. 有大型云计算公司工作经历者优先。
● 技术技能
  1. 能够主导公有云平台云网络某领域的架构设计,如大规模VPC网络设计,广域网流量调度设计,弹性NFV网元设计,云服务网络接入设计等。能合理的对该领域的系统演进和技术选型作出决策。
  2.能够梳理大型云网络系统架构,通过治理、改进等方式对架构进行优化,提出并落地简单易于维护的解决方案。
  3. 具备业务和技术洞察能力,熟悉主流云厂商技术架构演进趋势,熟悉技术领域相关的前沿技术,能够对技术领域技术架构大图作出规划。
  4. 具备复杂系统的研发安全生产经验,保障产品和技术领域的安全和稳定性。
  5.精通2~3项网络性能优化及加速关键技术,包括硬件Offload技术,网络可编程技术,DPDK技术,ebpf技术,RDMA技术等。
  6. 精通TCP/IP协议和VxLAN网络虚拟化技术,熟悉BGP路由协议,二层网络交换技术等。
  7. 熟悉主流的计算虚拟化技术,包括KVM Hypervisor,Kubernates容器平台等相关技术。
  8. 熟悉业界主流交换芯片相关的驱动程序和SDK,具备控制面和数据面软件的开发能力。
  9. 熟悉Underlay网络架构,包括数据中心CLOS组网架构,广域网MPLS/SRv6隧道技术等。
  10.熟悉大语言模型/生成式AI的业务流量特点以及大模型AI集群建设的关键技术,包括Transformer架构,大模型训练并行策略,GPU互连技术,GPU direct RDMA技术等。
● 其他要求
  1. 具备从全局视角思考技术,通过技术产生业务价值。
  2. 具备清晰的逻辑思维能力,良好的沟通和团队协作能力以及强烈的责任心。
  3. 持续学习和自我提升的态度,对新技术保持高度的热情和好奇心。

工作职责


● 公共云计算作为基础设施为企业提供高效、安全、可靠的云服务,极大地提高了企业的运营效率和创新能力。阿里云作为全球化的公共云计算平台,在云网络领域也走在行业的前列。
● 阿里云网络的洛神技术平台,基于软硬件一体化技术,云原生弹性NFV技术,大规模SDN网络管控技术,大数据智能网络分析平台,支撑了阿里云丰富的网络产品。
● 本岗位负责阿里云网络架构设计和云网络技术创新。
  1. 架构设计方面负责云网络架构技术领域的设计和规划,以及对现有架构进行梳理、评估和优化,推动架构演进,提升云网络技术竞争力。 
  2. 技术创新方面通过业务和技术洞察,分析云网络技术发展趋势,提炼对云网络的技术要求,对关键技术进行突破。
包括英文材料
系统设计+
流量调度+
eBPF+
TCP/IP+
SDK+
大模型+
Transformer+
相关职位

logo of aliyun
社招8年以上云智能集团

1、技术规划 • 持续跟踪弹性计算领域软硬件相关领域的技术发展趋势,深入了解可以业务应用场景规划和推动产品新技术的规划和落地 • 负责弹性计算硬件产品技术规划,主导包括系统方案/架构/配置、硬件核心技术创新,提前管理设计的需求匹配性及质量风险 2、架构与解决方案设计 • 针对阿里云弹性计算对服务器或网络应用场景的需求分析,负责对接服务器团队完成服务器软硬件架构规划、网络软硬件架构规划及整体产品解决方案(包含但不限于芯片,存储,计算,网络等),输出市场需求书MRD,产品需求书PRD,产品规格书等关键文档。 • 制定合理的产品生命周期规划,做从需求分析到EOL的全生命周期管理 • 及时跟踪业界动态,针对性进行相关竞品分析和信息收集,保障解决方案的竞争力 • 组织梳理相关的软/硬件性能/可靠性测试评估 3、技术研发 • 针对硬件技术架构,性能特征, 匹配产品定位需求驱动相关的计算/存储/网络技术方案 • 分析业务整体逻辑/业务软件实现等,驱动软硬件方案落地 4、性能优化 • 通过弹性计算性能平台评估产品性能,驱动服务器系统,供应商, 弹性计算虚拟化,操作系统进行性能优化 • 对业务软件进行性能分析,结合系统软硬件适配调优,优化业务性能瓶颈

更新于 2025-08-18
logo of aliyun
社招8年以上技术类-开发

1、技术洞察和问题定义 •洞察网络技术发展方向,熟悉和定义技术标准以及前沿进展,跟踪关键竞对的技术和方法。 •结合产品现状定义网络问题,理解业务目标并分解到网络技术待解决问题中。 2、架构规划 •对业务的网络诉求进行架构抽象,建立业务长期发展的网络架构模型和规划。 •制定负责领域的网络架构规划和技术路线图,确定系统目标和方向,考虑关键技术选型、部署架构等多方面因素,确保网络架构的稳定高质量演进。 3、架构设计 •设计网络架构方案,包括规模能力、架构互联、路由、高可靠等。 •拆解关键设计目标为架构系统设计方案,全面评估技术选型、成本、稳定性、部署复杂度等多方面进行架构详细设计。 4、架构落地 • 详细设计架构落地的依赖,并设计和推动各组件和团队进行设计开发,以支撑架构落地。 • 设计测试方案,针对架构设计的关键feature和组件进行全面测试评估,确保技术可行性、性能、稳定性等满足设计预期。 • 输出架构详细设计LLD文档和架构测试文档,向运营团队输出架构运维指导。 5、技术沉淀和赋能 •团队技术架构分享、技术文档和架构规范沉淀、竞对技术调研和分析、学习引入新的网络技术,学习并分享负责业务方向的业务架构,尤其成为业务对网络部分的专家,形成文档沉淀。

更新于 2025-06-07
logo of bytedance
社招3年以上A248618

1、洞察云网络技术发展趋势、市场动态、用户需求变化,识别共性需求和用户痛点,推进产品能力迭代和竞争力构建; 2、针对客户的云网络需求,协同销售、售前进行需求分析,支持云网络的架构和解决方案设计,提供相应最佳实践; 3、深入洞察典型客户场景,设计和构建有竞争力的云网络解决方案,助力客户,提升市场影响力。

更新于 2025-04-17
logo of antgroup
社招5年以上技术类-开发

蚂蚁HCS 算力服务是全站通算,智算资源管理的基础设施平台, 通过Kubernetes等容器和平台技术,为上层业务提供云原生服务,AI算力服务,全局资源动态分配,调度节点单集群规模超过万台,同时致力于在系统、业务多个层面,包括os/kernel、容器/PaaS、智能调度/仿真容量等进行技术突破,提高容器系统规模化的资源利用效率,降低大促等各种大规模复杂业务场景下的资源成本,打造智能、高效、稳定的智算基础设施平台,HCS产品架构师的职责包括: ● 平台架构设计: 在日益复杂的AI异构的大背景下,主导设计并构建能够支撑大规模算力交付的平台架构,涵盖系统,内核,存储,网络,算力,kubernetes,确保平台具备高性能、高可用、弹性扩展和安全性,满足海量业务场景需求。 ● 算力交付体系构建: 建立高效的算力交付体系,优化资源调度和分配策略,实现算力的快速供给和弹性伸缩,降低业务获取算力的复杂度,和提升算力使用体验。 ● 算力优化架构:设计和建设智算时代的通智一体的算力架构,实现算力的分时,混部,隔离,一体化调度的架构,充分满足业务的同时,提升资源利用率 ● 经营体系搭建: 构建算力服务的经营体系,制定合理的资源定价模型和计费策略,建立完善的成本控制和收益分析机制,推动平台实现商业化运营。

更新于 2025-06-11