logo of aliyun

阿里云阿里云智能-数据库管控研发专家-杭州/北京

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1. 熟悉 Linux 操作系统,熟练掌握 Java/Python/Golang 语言中的至少一种,可以通过编写程序解决工作中遇到的问题,具备良好的编程风格,熟悉多线程高并发网络编程。
2. 熟练掌握 MySQL 等主流数据库高可用架构及运行机制,对各数据库优劣和适用场景有深入的理解,能根据具体场景进行数据库选型和模型设计;
3. 熟练掌握数据库性能优化技巧,能够定位全链路上的性能瓶颈(网络、CPU、IO、操作系统等),并解决问题
4. 具备很强的 ownership,有很好的技术敏感度和风险识别能力,有不断钻研和探索的精神,敢于挑战自我,有解决疑难问题的毅力和决心。
5. 良好的沟通表达能力,具备优秀的文档能力,可以使用文字、图示清楚地表达架构意图,能够熟练编写各类技术文档。
6. 具备大规模管控平台、运维平台研发经验,具备可观测 AIOps/MLOps/DataOps 开发经验者优先。

【加分项】
1、熟悉Kubernetes等开源云平台,熟悉Docker容器技术,熟悉Hadoop/Spark/Flink数据分析平台,具有丰富经验或者深入研究过源码的优先;
2、有大规模互联网产品研发经验,有云厂商IaaS或者PaaS产品开发经验的优先;

工作职责


1、技术方案设计,技术方案的落地与实现,并确保产品稳定性并持续提升产品性能实现性能优化,
2、参与从用户侧到后端资源侧,数据链路,控制链路,性能日志采集,审计,检索,分析等一整套分布式系统的研发,提供全球数据库服务;
3、利用云原生,基于K8S,Docker,云上ECS/神龙,云盘,VPC等云原生技术与数据库技术结合,给用户提供优质体验,高性价比,易用,高性能的云数据库服务;
4、通过产品化,智能化方式管控阿里云和阿里巴巴经济体的大规模分布式数据库实例集群,并支撑公共云和集团业务需求,为双十一等大促场景提供稳定,顺滑的体验。
5、参与数据库 DBaaS 平台的产品规划和平台技术演进。
包括英文材料
Linux+
Java+
Python+
Go+
多线程+
高并发+
网络编程+
MySQL+
高可用+
Kubernetes+
Docker+
Hadoop+
Spark+
数据分析+
IaaS+
PaaS+
相关职位

logo of aliyun
社招5年以上云智能集团

1、技术方案设计 • 参与云产品管控系统的架构升级和优化工作,根据管控系统的稳定性、性能、安全等目标设计相应的技术方案,并明确方案目标、范围和交付成果; • 基于需求进行技术可行性分析和方案评审,结合当前的技术架构进行合适的技术选型和功能设计。完成技术架构和数据架构设计,并推进开发流程。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; • 负责核心功能的架构与代码模板的编写,开发与维护管控系统核心业务模块,优化程序性能等; • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署; • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、产品体验改善、性能和成本优化等; • 编写技术文档,如操作手册、故障排除指南、API文档等,以支持日常答疑运维工作。 3、安全、稳定、效率和性能优化 • 通过数据分析,稳定性研究和性能测试,持续推动升级和优化云产品管控架构,实现高可用、高性能的管控系统; • 运用产品优化技术和方法,实现安全保障和优化系统性能,提高阿里云产品管控安全性,同时帮助客户提效,给客户更好的体验。 4、技术预研 • 跟踪和了解国内外云计算技术和分布式计算技术的发展和趋势,结合业务实际需要提供有效的技术支持和架构建议。 5、技术规划 • 理解业务重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-08-28
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云容器产品管控系统的架构设计、功能开发和运维管理,打造稳定易用的容器服务管理平台。 2. 维护高性能、高可用的阿里云容器管控服务,保障业务系统在全球地域的稳定性。 3. 深入参与产品全生命周期研发管理,持续优化提升产品安全、稳定、性能、功能与用户体验,以技术驱动业务增长。 4. 推动系统架构演进及优化,关注前沿技术发展,完成技术预研和技术难点攻关。

更新于 2025-09-09
logo of aliyun
社招5年以上云智能集团

1、技术方案设计 • 参与云产品管控系统的架构升级和优化工作,根据管控系统的稳定性、性能、安全等目标设计相应的技术方案,并明确方案目标、范围和交付成果; • 基于需求进行技术可行性分析和方案评审,结合当前的技术架构进行合适的技术选型和功能设计。完成技术架构和数据架构设计,并推进开发流程。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; • 对编码进行阶段性的讨论和CodeReview,完成功能测试和性能测试,推动代码成功部署; • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、产品体验改善、性能和成本优化等; • 编写技术文档,如操作手册、故障排除指南、API文档等,以支持日常答疑运维工作。 3、安全、稳定、效率和性能优化 • 通过数据分析,稳定性研究和性能测试,持续推动升级和优化云产品管控架构,实现高可用、高性能的管控系统; • 运用产品优化技术和方法,实现安全保障和优化系统性能,提高阿里云产品管控安全性,同时帮助客户提效,给客户更好的体验。 4、技术预研 • 跟踪和了解国内外云计算技术和分布式计算技术的发展和趋势,结合业务实际需要提供有效的技术支持和架构建议。 5、技术规划 • 理解业务重点,基于业务需求做出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-10-13
logo of aliyun
社招5年以上云智能集团

1.构建盘古分布式文件系统的标准化输出能力,提高系统的自动化部署、运维能力; 2.梳理盘古分布式文件系统管控系统的依赖,降低对外部系统的依赖,建立运维管控系统回归测试能力; 3.重构盘古管控系统的数据层和逻辑层,确保系统在迭代更新的过程中始终保证兼容性和服务稳定; 4.对接阿里云安全体系和基础管控系统,确保系统能在多用户环境下安全稳定运行。

更新于 2025-09-11