阿里云阿里云智能-云网络产品专家-AI领域-杭州
任职要求
1、熟悉主流云厂商的网络产品(如 VPC、EIP、SLB 等)及其基础架构,了解 AI/ML 工作负载对网络在延迟、带宽和拓扑等方面的新需求,具备5年及以上相关经验; 2、在网络虚拟化、SDN、高性能网络、智能运维或 AI 场景网络等方向中,具备一定的技术理解或实践经验; 3、具备云网络产品设计或解决方案落地…
工作职责
1、技术前瞻与需求洞察:跟踪云计算与网络领域的前沿技术趋势,重点研究 AI/ML 工作负载(如大模型训练与推理)对高性能网络的新需求,提炼产品创新方向; 2、竞品与市场分析:持续关注主流云厂商在网络虚拟化、高性能网络、AI 推理网关等方向的产品演进,输出竞品分析与市场洞察,支持产品演进,驱动产品差异化与战略决策; 3、产品全生命周期管理:负责核心云网络产品(如 VPC、EIP、SLB、云企业网等)的功能规划、需求分析、产品设计及商业化运营,推动产品规模增长; 4、端到端解决方案设计:面向用户多样化的业务场景,设计端到端的云网络解决方案,综合平衡性能、延迟、弹性、安全与成本等关键维度; 5、跨职能协同落地:联动网络架构、研发、运维、售前等团队,高效推进产品从规划、开发到上线的全流程,确保高质量交付与用户体验; 6、产品运营与持续迭代:负责产品上线后的运营,包括用户培训、客户交流、市场活动支持、反馈闭环机制建设,并基于数据驱动实现产品的持续优化与体验升级。
1. 负责云网络高性能数据转发平台的研发和演进,为AI大模型训练与推理提供高吞吐、低延时的网络服务; 2. 负责软硬件结合方案的设计,研究通过软硬件协同加速方案在Vswitch、网关与网元领域的创新应用; 3. 根据灵泽产品需求定义软硬件接口和驱动架构,负责撰写设计文档,以及开发实现; 4. 负责业界转发面新技术探索,优化网络转发架构,打造技术先进性。
1. 参与运维可观测链路建设: 1.1 建立并持续优化产品运维的监控机制,研发并维护相应的运维监控平台/工具; 1.2 建立并持续优化产品运维的预警机制,确保故障能够被快速发现、通报、定位及处理; 1.3 建立快速分析、诊断、定位问题能力,并能够协同开发人员分析解决问题。 2. 参与运维可自愈链路建设: 2.1 建立健全快速恢复服务机制,降低业务受损程度,确保产品、业务稳定运行; 2.2 建立故障注入机制,模拟生产故障场景,验证产品稳定性水位,提前发现系统能力短板。 3. 运维自动化体系建设: 3.1 建设本领域相关的运维体系,如变更标准、重保体系、客情预警等,确保本领域产品运维&稳定性能力提升; 3.2 建设稳定性能力的数据化体系,通过数据驱动方式持续治理稳定性风险; 3.3 建设网络质量自动化探测评估体系,并结合观测链路和自愈链路,自动化隔离网络抖动带来的服务影响。
1. 负责阿里云云平台网络边界防御方案设计。结合云平台的网络架构,设计可落地的防御方案(防火墙、WAF、蜜罐等),并推广部署; 2. 防御能力迭代和高危漏洞响应。基于各类威胁情报,及时更新防御策略;基于LLM、专家经验等能力,优化防御策略; 3. 技术研究与敌情感知:跟踪突破边界的攻防新技术(LLM 应用攻防、AI驱动的攻击识别、高危漏洞研究等),主动感知可能威胁云平台的对象。