logo of aliyun

阿里云阿里云智能-应用管理平台技术专家-北京/杭州

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


岗位要求:
1、 熟悉Java基础技术栈,包括SpringBootMybatis、分布式缓存消息队列等,熟MySQL等主流数据库以及Linux下的常用命令
2、熟悉常用设计模式,最好有大型应用的开发经验,具备应对大数据、分布式、高并发高负载高可用性等系统设计能力
3、熟悉C++Python开发优先,熟悉AI大模型K8S开发&运维能力优先,熟悉日志查询、计算调度和存储引擎开发优先
4、具备良好的抽象设计能力,思路清晰,善于思考,能独立分析和解决问题,责任心强,具备良好的团队合作精神和承受压力的能力

工作职责


阿里专有云应用运维与可观测团队,为专有云客户提供极致用云的解决方案与产品矩阵,帮助企业更好地管理IT服务和基础设施,提高运维效率、运维安全性以及业务连续性
岗位职责:
1、 参与并负责云+应用一体化运维平台的设计与实现,包括应用蓝图、自动化发布、应用容灾、资源编排等能力
2、参与并负责全景监控的设计与实现,围绕健康画像构建监管控一体化AIOPS运维平台,实现故障的快速发现、智能定位以及高效恢复链路闭环
3、参与并负责专有云日志服务SLS的设计与实现,为Log、Metric、Trace等可观测数据提供一站式采集、加工、查询与分析、可视化与告警、消费与投递等能力
4、参与并负责专有云应用市场的设计与实现,基于开发者中心与交付中心打造专有云产品生态体系
5、参与并负责专有云统一CMDB、流程引擎、终态引擎、监控采集和计算等基础技术的设计与实现
包括英文材料
Java+
Go+
编程规范+
网络编程+
多线程+
TCP/IP+
HTTP+
XML+
HTML+
Unix+
Linux+
Perl+
Python+
Bash+
脚本+
数据结构+
算法+
Spring Boot+
MyBatis+
缓存+
消息队列+
MySQL+
设计模式+
大数据+
高并发+
高负载+
高可用+
系统设计+
C+++
大模型+
Kubernetes+
相关职位

logo of antgroup
社招5年以上技术-开发

1、负责蚂蚁集团云计算、大数据、大模型平台等基础设施的数据安全风险管控技术方案设计与建设。

更新于 2025-09-08
logo of aliyun
社招3年以上云智能集团

1、参与AI管理平台的产品功能规划、设计与研发,实现AI资源、资产管理以及提供AI训练、推理服务; 2、关注AI前沿发展,面向AI开发流程,设计从模型到异构算力的灵活调度和极致效率,打造“云+AI”的云原生AI PaaS平台; 3、面向大规模、分布式的智算场景,实现数据加速、训练弹性、模型推理优化、模型部署优化等平台能力。

更新于 2025-09-12
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云容器产品管控系统的架构设计、功能开发和运维管理,打造稳定易用的容器服务管理平台。 2. 维护高性能、高可用的阿里云容器管控服务,保障业务系统在全球地域的稳定性。 3. 深入参与产品全生命周期研发管理,持续优化提升产品安全、稳定、性能、功能与用户体验,以技术驱动业务增长。 4. 推动系统架构演进及优化,关注前沿技术发展,完成技术预研和技术难点攻关。

更新于 2025-09-09
logo of aliyun
社招5年以上云智能集团

我们正在寻找一位充满激情、经验丰富的高级技术专家,加入我们的创新团队,共同面对并解决在Serverless GPU和AI应用平台领域中的挑战性问题。 1.负责Serverless计算及AI应用托管平台的架构设计与持续优化。包括异步事件处理、GPU资源调度与弹性伸缩,AI 应用和模型托管等核心功能的设计。保障系统的高可用性、可扩展性和安全性。 2.理解业务战略及重点,并进行相应的技术架构规划并推动落地。能够为开发团队提供专业的技术指导和支持。推动分布式系统、AI应用托管等领域的知识共享和技术创新。 3.深入分析系统性能瓶颈,实施有效的优化策略,提高系统响应速度和资源使用效率。 4.加强与产品、开发、运维等部门的合作,确保技术方案的有效实施,克服项目推进中的各种障碍。 5.为关键客户提供技术支持,针对使用Serverless平台过程中出现的难题给予及时有效的解决方案,维护良好的产品体验。

更新于 2025-09-09