logo of aliyun

阿里云阿里云智能-容器平台研发专家-北京/杭州

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1. 5年以上 Go/Java 架构设计开发经验,具备复杂分布式系统架构设计及开发经验。对云产品API设计、分布式系统架构、数据库、Linux操作系统等有深入理解,具备一定的 Linux系统应用运维经验。
2. 5年以上控制台架构设计开发经验,具备PC端中大型复杂前端项目架构设计和开发经验,熟练掌握至少一种主流前端框架(React优先)和相关组件库、工具链,熟悉 WebpackVite 等构建工具,具备扎实的前端工程化能力。
3. 有云计算产品或 Kubernetes 等容器产品开发运维背景者优先,有Kubernetes相关开源项目贡献者优先。
4. 具备出色的沟通协调与项目管理能力,能够独立主导大型项目并保障按时高质量交付。
5. 对技术有激情,喜欢钻研,具备良好的业务理解与创新能力。

工作职责


1. 负责阿里云容器产品管控系统的架构设计、功能开发和运维管理,打造稳定易用的容器服务管理平台。
2. 维护高性能、高可用的阿里云容器管控服务,保障业务系统在全球地域的稳定性。
3. 深入参与产品全生命周期研发管理,持续优化提升产品安全、稳定、性能、功能与用户体验,以技术驱动业务增长。
4. 推动系统架构演进及优化,关注前沿技术发展,完成技术预研和技术难点攻关。
包括英文材料
Go+
Java+
系统设计+
分布式系统+
Linux+
React+
Webpack+
Vite+
Kubernetes+
相关职位

logo of antgroup
社招3年以上技术-基础平台

云原生容器平台是全站资源管理的基础设施平台,通过Pouch,Kubernetes等容器和平台技术,为上层业务提供标准容器服务和全局资源动态分配,调度节点单集群规模超过万台,同时致力于在系统、业务多个层面,包括os/kernel、容器/PaaS、智能调度/仿真容量等进行技术突破,提高容器系统规模化的资源利用效率,降低大促等各种大规模复杂业务场景下的资源成本,打造智能、高效、稳定的金融级基础系统。 1、基于Kubernetes打造高性能、高可用的大规模容器计算平台,通过优化/定制/开发Kubernetes平台核心组件,实现业务对平台的功能及性能需求; 2、负责平台稳定性建设,解决操作系统内核、大规模分布式系统等领域的众多技术挑战,为蚂蚁数十个大规模集群保驾护航; 3、以产品化思维完善基础设施平台的服务设计,在平台之上设计开发新的功能体验,打造面向用户应用的智能基础设施平台。

更新于 2025-07-01
logo of aliyun
社招3年以上云智能集团

1. 研发需求洞察与设计:负责阿里云人工智能平台PAI的需求讨论、架构设计、软件开发、功能测试及部署上线,确保项目从初始阶段到交付的全流程高质量执行; 2. 系统优化:从功能、性能、可用性、易用性等多个维度,结合产品设计、产品设计和解决方案架构及客户反馈,进行系统各模块的持续分析和优化,降低用户使用门槛,提升用户满意度和忠诚度; 3. 技术支持与维护:负责线上环境的运行监控与问题定位,与SRE和售后团队紧密协作,及时为客户提供技术支持,保障平台的稳定运行; 4. 前沿技术开发:紧贴大模型及AIGC等业界趋势,提炼并反馈有价值的用户需求,持续增强和改进平台的功能,保持技术的先进性和市场竞争力。

更新于 2025-07-07
logo of aliyun
社招5年以上云智能集团

1、技术方案设计,技术方案的落地与实现,并确保产品稳定性并持续提升产品性能实现性能优化, 2、参与从用户侧到后端资源侧,数据链路,控制链路,性能日志采集,审计,检索,分析等一整套分布式系统的研发,提供全球数据库服务; 3、利用云原生,基于K8S,Docker,云上ECS/神龙,云盘,VPC等云原生技术与数据库技术结合,给用户提供优质体验,高性价比,易用,高性能的云数据库服务; 4、通过产品化,智能化方式管控阿里云和阿里巴巴经济体的大规模分布式数据库实例集群,并支撑公共云和集团业务需求,为双十一等大促场景提供稳定,顺滑的体验。 5、参与数据库 DBaaS 平台的产品规划和平台技术演进。

更新于 2025-09-22
logo of aliyun
社招5年以上云智能集团

团队整体实行 DevOps,SRE 在其中系统化分析并解决研发流程中的效率与质量问题,打造易用、高效、可复用的效能平台和工具,全面提升分布式块存储产品的持续交付质量和效能。主要职责包括: 1. CI/CD 平台与效能工具链建设: 负责设计、开发和维护高效的 CI/CD 持续集成与交付平台; 2. 搭建核心测试框架与自动化测试工具链;优化测试流程效率,保障测试环境的稳定性与易用性,并有效控制研发成本,从而显著提升研发体验与整体效率; 3. 质量风险分析与效能体系构建: 系统化评审分布式块存储系统的质量风险点,主导构建和完善系统级测试能力;设计并实现覆盖复杂业务场景的用例,持续提升覆盖率和有效性,保障系统质量; 4.云原生测试环境建设: 运用 Kubernetes, Docker, Golang 等云原生技术,构建并维护稳定、高效、易于管理的多架构(如 x86/ARM)容器化环境,为高效测试提供坚实基础; 5. 负责对技术团队和相关模块进行质量水位的评估和考核,并提出改进意见。熟知质量理论和方法,能运用新的AI技术来做质量提效,并在研发中传帮带和推广。持续提升各技术团队的质量意识和测试技术水平。

更新于 2025-07-29