logo of aliyun

阿里云阿里云智能-网络运营解决方案支持技术专家-杭州

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1、5年以上大型数据中心网络规划、建设或运维经验,熟悉主流网络架构与协议。持有IT行业专家级别证书以及ITIL、DevOps 等相关行业资质者优先。
2、具备网络运维工具或自动化脚本(Python/Shell等)开发维护能力。
3、有项目管理经验,能独立协调资源推进客户问题解决,持有PMP或类似认证者优先。
4、熟练使…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、编写、修订数据中心网络监管控平台与流程平台的用户手册及技术文档。
2、面向全球客户开展运维平台使用培训,提供操作指导与最佳实践建议。
3、响应并处理客户关于平台使用工单,确保问题高效闭环。分析归纳客户问题,推动平台功能优化与迭代。
4、提供驻场服务,与客户共同诊断并解决复杂网络运维问题,保障系统稳定运行。
5、牵头跨团队复杂项目(如解决方案版本迭代,大客户项目交付等),推动技术和业务目标落地。
包括英文材料
DevOps+
脚本+
还有更多 •••
相关职位

logo of alibaba
社招5年以上技术类-开发

部门介绍: AE 技术部致力于打造全球买、全球卖的极致购物体验,通过世界一流的技术架构,服务全球200+多个国家和地区的数亿消费者与数十万卖家。面对多元化的用户需求、本地化挑战以及独特的数据安全政策,我们构建了独特的系统部署与架构设计,涵盖基础链路、用户增长,商家商品,运营平台及泛导购等核心领域,为全球电商业务提供创新解决方案! 1、负责全球重点国家和地区合规业务的Java后端技术方案设计与实现,关注数据隐私保护、商品合规、税务合规等关键领域。 2、与法务、合规、产品和运营团队紧密协作,开发高可用、可扩展、安全合规的服务端系统,以满足全球市场的法规要求。 3、主导技术解决方案的创新,确保系统在复杂合规场景下的稳定运行和高效性能。 4、参与关键业务流程的优化,通过技术手段提升合规效率,降低业务风险。 5、持续关注行业动态,推动合规技术的前沿实践,为阿里巴巴的跨境电商合规系统提供技术支持。

更新于 2026-01-08杭州
logo of aliyun
社招5年以上技术类-开发

负责阿里云全球网络的服务化平台研发,包括但不限于平台开发、模型/算法构建、海量数据分析处理等。 阿里云基础设施网络研发事业部,负责整个阿里巴巴网络基础设施的研发、建设和运维,始终坚持利用软/硬件技术及研究,针对业务需求研发网络解决方案,给公司业务提供强有力支持。广域网架构与研发团队,作为网络研发事业部核心团队之一,负责设计、研究、建设、运营面向全球的阿里巴巴广域网络,实现网络的高可靠、高可用、低成本,并不断提升用户体验。 具体岗位职责: 1. 负责阿里全球网络的数据分析、网络优化、资源规划等自动化和智能化系统研发,包括但不限于面向稳定性保障、质量优化和成本经营的算法、模型和平台研发 2. 负责阿里全球网络的质量探测与保障、网络监控、流量采集、Qos管控等系统设计研发 3. 负责阿里全球网络流量调度系统设计和研发,实现云边一体、端网融合、全球加速等目标

更新于 2025-06-17北京|杭州
logo of aliyun
社招5年以上云智能集团

1、运维可观测链路建设 • 负责全链路稳定性解决方案的制定与执行,包括交付、变更、应急及稳定性专项建设; • 事前:建立并持续优化产品运维的监控机制,研发并维护相应的运维监控平台/工具; • 事中:建立并持续优化产品运维的预警机制,确保故障能够被快速发现、通报、定位及处理; • 事后:快速分析、诊断、定位问题,并能够协同开发人员解决问题;建立健全快速恢复服务机制,降低业务受损程度,确保产品、业务稳定运行;牵头问题复盘工作,通过架构优化等根治引起不可用的问题。 2、运维平台产品化与智能化建设 • 设计、研发并维护智能化的运维平台、工具、系统,帮助解决生产系统遇到的容量、性能、稳定性等问题,提升性能与效率; • 负责运营质量数据化分析工作,通过对日常运维指标、问题、风险、稳定性结果进行分析和研究,建立模型、计算ROI/TCO来解决、优化和落地给出运营优化建议; • 负责高可用体系建设,如巡检、故障自动定位、自动恢复、自适应容灾、云原生技术实施及落地等,保障业务持续可用。 • 负责运维能力的抽象与设计,通过平台实现运维能力产品化,建立配套的标准运维手册,提升运维的易用性/完整性和降低误操作风险(专有云); • 将运维服务产品化能力传达给客户,建设客户心智,提升运维服务效率(反馈增加) 3、运维服务体系建设 • 建设本领域相关的运维体系(如变更标准,重保体系,客情预警等),确保本领域产品运维&稳定性能力提升; • 牵头制定本领域内的相关新产品\新功能的的SLA协议承诺; • 基于SLA要求,评审新产品\新功能的架构是否可用、安全; • 通过日常运维活动优化产品稳定性,达成SLA目标; 4、容量规划与调优 • 基于年度的产品线规划,进行预算编制、容量规划与置备,协调各方持续滚动进行存储、计算等资源消耗的预测与估算; • 通过技术手段提升线上资源利用效率,降低物理资源成本(如结合对于业务波峰/波谷等的预测,进行混合部署)。 • 通过云平台与云产品的容量模型设计与调优以及配套的工具建设,降低云平台因为资源问题带来的稳定性风险并提升资源利用率(专有云) 5、安全保障建设 • 日常on call值班,及时响应告警及技术支持升级的疑难问题,并解决; • 负责集团级重大活动(如双11等)的运维保障工作; • 配合安全团队,梳理安全漏洞,优化相关技术架构,提升产品与系统的安全性。 • 负责云平台风险管理能力建设,通过风险策略库建设提前识别风险,建立风险预警和治理机制,推动云平台风险治理提升客户稳定性(专有云) 6、平台架构升级 • 负责系统架构升级,如内核升级、网络架构升级、存算分离、服务跨机房迁移、服务上云 • 负责容灾架构设计并实施,如同城容灾、异地多活等 • 负责云平台软硬件生命周期设计,制定升级方案,通过商务法务产品与服务策略制定,推动客户云平台持续演进(专有云) • 负责云平台的分层设计,并通过依赖与兼容性治理与优化,实现云平台分层解耦,提升交付、升级的灵活性与稳定性(专有云)

更新于 2025-07-15杭州
logo of aliyun
社招5年以上云智能集团

1、日常运维 • 负责数据中心日常运维及管理工作,制定数据中心基础设施运维策略与运维计划,保障设施稳定性,均衡考虑运维质量、效率、成本及安全 • 通过设施数字化运维管理,提高机房管控能力和兜底能力,保障维修及时率、风险闭环率等各项指标达标。 2、安全合规 • 落实数据中心内所有岗位的安全生产要求,推动数据中心在环保、消防、职业健康、法务、廉正等方面的合规运营,防止出现人员/设备的重大责任事故、行政处罚/责令整改等被动监管事件。 • 识别安全合规风险,建立并完善风险管理机制,负责重大事件的上报和跟踪处理。 • 建立属地资源网络管理,推动与属地政府关系的全方位深化,为属地稳定安全合规运营提供坚实保障。 3、优化改进 • 负责所辖数据中心的设施运维工作优化,制定/梳理阿里IDC运维管理制度、操作手册、应急管理流程和应急操作预案。 • 负责阿里IDC能效优化工作,实现机房高效运行。 • 负责协同经营成本团队,通过建立成本分析模型、人效模型,实现对成本效率的精细化分析管控,达成经营目标。 4、技术支撑 • 负责数据中心运维侧技术管理,能带领团队通过技术管理为数据中心设计、设备选型等技术迭代提供技术支撑。 • 承担业务设备的现场技术支持,了解业务需求和网络结构,通过团队合作有效支撑数据中心运营。 5、团队管理 • 负责数据中心运维团队的日常管理、考核、人才梯队建设、能力培养,规划数据中心运维人员技术培训工作,提升运维团队服务水平。 • 建立与运营商、上级主管等部门间顺畅的沟通渠道,防止出现数据中心运营风险,确保阿里运营策略要求合规落地。

更新于 2025-11-10杭州