阿里云阿里云智能-容器SRE平台AI基础设施运维专家-北京/深圳/杭州

社招全职5年以上云智能集团2025-07-31地点：北京 | 深圳 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 5年以上IT、互联网、云计算行业运维工作经验，有AI运维开发相关经验者优先；
2. 熟悉Linux操作系统和TCP/IP等主流协议，有扎实的操作系统和网络问题处理经验；
3. 熟悉容器和kubernetes，slurm，lsf等编排技术，有Kubernetes集群…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责灵骏专属云各计算集群交付运维工作, 并且专属云参与基础运维平台架构设计和建设；
2. 灵骏专属云运维服务体系建设与优化，达成产品稳定性与SLA目标；
3. 制定专属云交付标准, 沉淀运维规范, 通过工具平台提效日常工作；
4. 跟进内外部合作伙伴项目, 优化专属云项目流程；
5. 需要具备一定的创新突破和个人自驱力，善于发现问题，思考并解决问题；
6. 该职位涉及值班响应的职责，在服务级别协议（SLA）时间内做出对客响应，推动客户问题的解决，改善客户体验。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Linux+

还有更多 •••

登录查看完整学习资料

相关职位

技术运营（SRE）专家/负责人

社招5年以上智能与信息技术

1.负责理想汽车软件、芯片研发基础设施的运营管理，保障核心应用的稳定可靠运行，结合业界技术演进迭代基础设施架构，通过规范化、标准化、自动化、智能化等手段不断提升运营效率和服务质量。 2.研发构建核心基础设施工具链，以及相应监控、配置、日志、智能化运营（AIOps）能力建设，制定业务相关的运维技术方案，确保业务高效稳定的运行。 3.负责服务的容量规划和预测，软件的性能分析以及系统调优，软硬件系统的采购与服务部署等。 4.负责高可用和可观测体系建设，制定如全链路监控、故障定位、自动恢复、异地容灾等方案并落地实施，保障业务持续可用。 5.和算法、工程团队协同完成研发基础设施的智能化改造，构建新一代 AI 友好型研发基础设施。 6.负责技术运营（SRE）团队的日常管理，带领团队达成业务建设目标。

北京

技术运营（SRE）专家

社招5年以上智能与信息技术

北京

分布式KV缓存研发工程师(J250331011)

社招技术

1. 负责万亿级别QPS的分布式缓存/存储集群，支撑公司所有产品线的业务需求； 2. 设计、研发高可用、高性能的缓存/存储架构和中间件，应对弹性扩缩容，秒级故障自动切换，异地多活，分布式事务等极具挑战性的工作内容和方向； 3. 优化系统性能，深入内核，提升基础服务相关资源的使用率，增加系统稳定性，保障业务运行； 4. 设计并研发自动化运维平台，提升运维质量和效率，探索运维自动化和智能化技术和方向。

更新于 2025-04-01北京

搜索业务架构研发工程师

社招3-5年J0012

1、负责搜索C端业务需求的研发与实现； 2、负责搜索业务基础架构模块的升级与维护，提升搜索产品研发效率； 3、负责搜索容器产品及平台的的底层核心服务能力建设，借助云原生相关技术提升搜索引擎系统的平台化程度，实现搜索引擎的产品化； 4、负责搜索各类平台系统间的整体优化与整合，提升平台系统的稳定性/通用性/研发与使用效率。

更新于 2025-08-07北京