logo of tuhu

途虎养车运维开发专家

社招全职5年以上技术地点:上海状态:招聘

任职要求


1、计算机相关专业本科及以上学历,5年以上运维开发或开发经历;
2、优秀的编程能力,具备3年以上pythongo开发经验,至少熟悉flask/django/Tornado等任意一种python web框架;
3、熟悉Web前端htmljs,css等前端开发语言,熟悉VUE或…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责运维自动化、可观测性、GPU算力等平台能力的建设;
2、运用大数据、算法、智能AI等技术,实现运维故障定位、根因分析、自愈恢复和事后跟踪评估等能力;
3、完善现有运维管理自动化工作流程和方法,不断迭代实现运维交付工具的集成,提升运维及研发效率;
包括英文材料
学历+
Python+
Go+
Flask+
Django+
Tornado+
Web+
HTML+
还有更多 •••
相关职位

logo of aliyun
社招5年以上诚云科技

1. 负责公有云产品自动化部署平台编排及开发; 2. 负责基于框架做部署自动化流程编排及功能开发; 3. 负责云产品的日常运维及支撑交付问题支持。

更新于 2025-12-09杭州
logo of aliyun
社招5年以上技术类-开发

1、设计和实现高性能、可靠的对象存储系统,满足大规模数据存储和访问需求; 2、负责对象存储系统核心功能的研发,包括数据存储、数据访问、数据迁移复制等; 3、制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑问,保障系统安全可靠。运用产品优化技术和方法,进行性能优化。 4、分析用户需求,优化存储系统架构,提高系统的扩展性、灵活性和可维护性; 5、负责对象存储相关工具和平台的开发,提升对象存储系统的高运维性。

更新于 2025-04-15深圳|杭州
logo of aliyun
社招5年以上云智能集团

1. 负责 Linux 内核稳定性保障与热修复,保障宕机、夯机、网络抖动等关键故障的根因分析与快速恢复。 2. 基于 eBPF/BCC/BPFtrace 等技术构建高可靠、低开销的内核级观测、剖析体系,并将其作为核心数据源接入智能运维平台。 3. 设计并实现操作系统 AI Agent 架构,融合实时系统指标与大模型推理能力,支持故障预测、根因推断与自动化修复决策。 4. 参与 OS 运维平台建设,推动监控、诊断、配置管理与热补丁下发等模块的标准化、自动化与智能化演进。 5. 积极参与 Linux 上游社区,贡献稳定性相关补丁,提升云基础设施的长期可维护性与技术影响力。

更新于 2026-01-04深圳
logo of aliyun
社招5年以上技术类-开发

主要负责赤骥运维管控核心系统的的设计、开发工作,制定1-2年技术演进路线并实施以保持技术先进性,进而保障超大规模分布式存储系统的稳定性。包括但不限于: 1、构建安全合规的可观测系统,包括机器、网络、用户、业务指标等各类监控,提供秒级的响应报警,并进行智能分析及根因定位。 2、基于跨区域容灾的运维资产管理能力,以及智能检测熔断能力,进行超大规模分布式系统的变更管控,提供稳定安全的发布变更系统。 3、深入理解所负责系统的结构和隐藏问题,能够制定具体的方案改进,保持系统的稳定性和可维护性。

更新于 2025-04-15北京|杭州