logo of aliyun

阿里云阿里云智能-云网络产品专家-AI领域-杭州

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1、熟悉主流云厂商的网络产品(如 VPC、EIP、SLB 等)及其基础架构,了解 AI/ML 工作负载对网络在延迟、带宽和拓扑等方面的新需求,具备5年及以上相关经验;
2、在网络虚拟化、SDN、高性能网络、智能运维或 AI 场景网络等方向中,具备一定的技术理解或实践经验;
3、具备云网络产品设计或解决方案落地…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、技术前瞻与需求洞察:跟踪云计算与网络领域的前沿技术趋势,重点研究 AI/ML 工作负载(如大模型训练与推理)对高性能网络的新需求,提炼产品创新方向;
2、竞品与市场分析:持续关注主流云厂商在网络虚拟化、高性能网络、AI 推理网关等方向的产品演进,输出竞品分析与市场洞察,支持产品演进,驱动产品差异化与战略决策;
3、产品全生命周期管理:负责核心云网络产品(如 VPC、EIP、SLB、云企业网等)的功能规划、需求分析、产品设计及商业化运营,推动产品规模增长;
4、端到端解决方案设计:面向用户多样化的业务场景,设计端到端的云网络解决方案,综合平衡性能、延迟、弹性、安全与成本等关键维度;
5、跨职能协同落地:联动网络架构、研发、运维、售前等团队,高效推进产品从规划、开发到上线的全流程,确保高质量交付与用户体验;
6、产品运营与持续迭代:负责产品上线后的运营,包括用户培训、客户交流、市场活动支持、反馈闭环机制建设,并基于数据驱动实现产品的持续优化与体验升级。
包括英文材料
数据分析+
相关职位

logo of aliyun
社招5年以上云智能集团

1. 参与运维可观测链路建设: 1.1 建立并持续优化产品运维的监控机制,研发并维护相应的运维监控平台/工具; 1.2 建立并持续优化产品运维的预警机制,确保故障能够被快速发现、通报、定位及处理; 1.3 建立快速分析、诊断、定位问题能力,并能够协同开发人员分析解决问题。 2. 参与运维可自愈链路建设: 2.1 建立健全快速恢复服务机制,降低业务受损程度,确保产品、业务稳定运行; 2.2 建立故障注入机制,模拟生产故障场景,验证产品稳定性水位,提前发现系统能力短板。 3. 运维自动化体系建设: 3.1 建设本领域相关的运维体系,如变更标准、重保体系、客情预警等,确保本领域产品运维&稳定性能力提升; 3.2 建设稳定性能力的数据化体系,通过数据驱动方式持续治理稳定性风险; 3.3 建设网络质量自动化探测评估体系,并结合观测链路和自愈链路,自动化隔离网络抖动带来的服务影响。

更新于 2025-12-29杭州
logo of aliyun
社招5年以上云智能集团

1. 负责云网络高性能数据转发平台的研发和演进,为AI大模型训练与推理提供高吞吐、低延时的网络服务; 2. 负责软硬件结合方案的设计,研究通过软硬件协同加速方案在Vswitch、网关与网元领域的创新应用; 3. 根据灵泽产品需求定义软硬件接口和驱动架构,负责撰写设计文档,以及开发实现; 4. 负责业界转发面新技术探索,优化网络转发架构,打造技术先进性。

更新于 2025-11-20杭州
logo of aliyun
社招5年以上云智能集团

1. 依据公共云统一架构、OpenAPI规范、软件技术栈以及交付运维体系,负责公共云异构计算产品的研发与交付。深度参与研发流程,确保产品从研发到运维的全生命周期高效管理; 2. 跟踪和了解新的异构计算产品技术和趋势,探索前沿的GPU架构设计与技术,理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地; 3. 联合网络团队共同设计网络互联架构,针对分布式训练和推理业务场景,在软硬件协同及高性能网络方向上寻找性能优化的新途径,构建阿里云加速计算云服务器的核心竞争力; 4. 研发并持续改进系统的稳定性和安全性,制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,提高产品稳定性和性能确保平台的安全可靠运行,并不断提升对外服务质量标准。

更新于 2025-12-06杭州|上海
logo of aliyun
社招5年以上云智能集团

光网络运营团队负责阿里巴巴数据中心内光互连的规划、建设、测试和运营,致力于建设安全可靠,技术先进、可灵活调度、高效运营、大容量的信息传输通道,以支撑阿里云智能各项业务的发展。 • 负责全球全球骨干网、城域网、数据中心网络光网络巡检维护以及问题定位,并快速解决网络风险及故障; • 全球网络运营风险管理,负责网络生命周期的风险识别、规避控制和消除,涉及架构引入测试、验收、风险防范,确保网络服务满足稳定性需求; • 负责网络设备/光模块产品引入、质量控制、线上运营、链路故障维修支持和能力建设。 • 研发高可用的光互联网络规划、建设和运营平台; • 负责网络运营自动化脚本编写,推进网络的自动化运维能力; • 通过数据分析和研究,提前识别网络架构风险、设备软硬件风险、设备老化风险,预测故障; • 持续推动网络架构模型优化。

更新于 2025-12-18杭州