logo of aliyun

阿里云阿里云智能-网络自动化研发专家-杭州/北京

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1、5年以上IT、互联网、云计算等领域开发经验,精通Java/Go/Python等至少一种开发语言,熟悉缓存、分布式架构、消息中间件web开发等常用核心技术和框架;
2、精通工作中使用的技术栈,在设计、架构、并发、分布式、数据等一个或多个技术领域达到专家水平,能够识别并准确解决问题;
3、能够在中型复杂系统层面推动建立完善的研发安全生产体系,并推动落地,保障相关系统的可容灾、可观测、可处置、可运维、可快恢;
4、能主导核心业务或技术系统架构设计和实际编码,通过对代码的code review、设计评审、单测覆盖,确保功能的交付质量和鲁棒性,有较强的问题分析和问题解决能力;
5、有flink/storm/spark大数据平台使用经验优先,有mysql/redis/mongodb/elasticsearch/rocketmq/kafka等存储和消息中间件使用经验优先;
6、有网络工程研发背景优先,具备网络架构、路由协议、交换机软硬件基础知识优先;
7、具备AI大模型相关技术栈基础知识,有训练推理实践经验者优先。

工作职责


作为网络自动化研发专家,你会负责设计和开发支持阿里云业务的网络解决方案和相关自动化运维工具,基于分布式架构、大数据处理、SDN等先进技术,驱动下一代大规模网络基础设施的自动化运维和管理,如监控告警、故障定位、应急快恢、自动化变更、质量优化等。

具体岗位职责包括:
1、技术方案设计
• 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等
2、技术实现
• 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现
• 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等
• 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署
• 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、性能和成本优化等
3、稳定性和性能优化
• 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠
• 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能
4、技术规划
• 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地
包括英文材料
Java+
Go+
Python+
缓存+
中间件+
Web+
系统设计+
Code review+
Apache Storm+
Spark+
大数据+
MySQL+
Redis+
MongoDB+
ElasticSearch+
RocketMQ+
Kafka+
大模型+
相关职位

logo of aliyun
社招5年以上技术类-开发

1.参与灵骏裸金属服务器及EGS实例的研发工作,包括但不限于早期邀请测试、线上服务质量保证以及性能优化等关键环节,确保产品从研发到上线的全生命周期管理。 2.负责灵骏、EGS和阿里云服务(ACS)GPU的单元测试设计与实现,确保测试覆盖率满足高标准的产品准入和准出要求,为产品质量保驾护航。 3.研发并持续改进系统的稳定性和安全功能,保障平台的安全可靠运行,以应对复杂的网络环境和潜在的安全威胁。

更新于 2025-06-18
logo of aliyun
社招5年以上云智能集团

1、技术方案设计 • 参与云产品管控系统的架构升级和优化工作,根据管控系统的稳定性、性能、安全等目标设计相应的技术方案,并明确方案目标、范围和交付成果; • 基于需求进行技术可行性分析和方案评审,结合当前的技术架构进行合适的技术选型和功能设计。完成技术架构和数据架构设计,并推进开发流程。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; • 负责核心功能的架构与代码模板的编写,开发与维护管控系统核心业务模块,优化程序性能等; • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署; • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、产品体验改善、性能和成本优化等; • 编写技术文档,如操作手册、故障排除指南、API文档等,以支持日常答疑运维工作。 3、安全、稳定、效率和性能优化 • 通过数据分析,稳定性研究和性能测试,持续推动升级和优化云产品管控架构,实现高可用、高性能的管控系统; • 运用产品优化技术和方法,实现安全保障和优化系统性能,提高阿里云产品管控安全性,同时帮助客户提效,给客户更好的体验。 4、技术预研 • 跟踪和了解国内外云计算技术和分布式计算技术的发展和趋势,结合业务实际需要提供有效的技术支持和架构建议。 5、技术规划 • 理解业务重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-08-28
logo of aliyun
社招5年以上技术类-开发

负责阿里云全球网络的服务化平台研发,包括但不限于平台开发、模型/算法构建、海量数据分析处理等。 阿里云基础设施网络研发事业部,负责整个阿里巴巴网络基础设施的研发、建设和运维,始终坚持利用软/硬件技术及研究,针对业务需求研发网络解决方案,给公司业务提供强有力支持。广域网架构与研发团队,作为网络研发事业部核心团队之一,负责设计、研究、建设、运营面向全球的阿里巴巴广域网络,实现网络的高可靠、高可用、低成本,并不断提升用户体验。 具体岗位职责: 1. 负责阿里全球网络的数据分析、网络优化、资源规划等自动化和智能化系统研发,包括但不限于面向稳定性保障、质量优化和成本经营的算法、模型和平台研发 2. 负责阿里全球网络的质量探测与保障、网络监控、流量采集、Qos管控等系统设计研发 3. 负责阿里全球网络流量调度系统设计和研发,实现云边一体、端网融合、全球加速等目标

更新于 2025-06-17
logo of antgroup
社招3年以上技术类-开发

1. 负责图灵产品模块研发,理解数据资产、数据服务的业务和技术,独立设计技术方案并高质量的研发落地; 2. 持续通过技术手段、智能化手段提升系统的自动化运维和治理能力,做好PB级标签画像、百万QPS在线服务引擎和智能化人群定向的运维工作; 3. 持续研究数据资产、数据服务的业务知识和技术,迭代数据资产和服务平台能力;

更新于 2025-09-08