logo of aliyun

阿里云诚云科技-高级应用运维工程师-开源大数据平台

社招全职2年以上诚云科技地点:北京 | 杭州状态:招聘

任职要求


1、有K8S/主流开源大数据大数据引擎(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)的运维经验,熟悉分布式系统原理及Linux原理
2、熟悉Golang/Python/Java至少一门编程语言…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责阿里云开源大数据平台(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)运维工作,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等
2、研发大数据运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、智能诊断定界等
3、落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等
4、负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等
包括英文材料
Kubernetes+
大数据+
分布式系统+
Linux+
IaaS+
PaaS+
Go+
还有更多 •••
相关职位

logo of kuaishou
社招5-10年D11431

1、主导(参与)规划和设计快手新一代 Data + AI 生产管治平台的后端技术体系以及软件架构,包括 离线/实时开发平台、数据安全、数据地图、大模型数据同步/任务调度等系统; 2、充分利用模型微调、提示词工程、RAG等大模型技术构建智能开发 / 运维 / 治理等生产智能化能力; 3、充分利用微服务、容器化等技术构建高可用、高扩展和低耦合高内聚的数据中台服务; 4、了解业界相关技术体系,为快手数据产品研发引入创造性的技术方案,解决面临的各种复杂问题和挑战。

更新于 2025-08-25北京
logo of didi
社招8年以上技术

1、负责网约车交易市场一站式智能策略平台的整体架构设计、搭建与落地;推动数据、特征工程、样本管理、机器学习、策略引擎、实验评估等能力的全域打通,构建一体化策略研发底座,标准化、工程化的策略研发与迭代体系,适配交易市场多业务场景的策略研发需求; 2、保障策略平台的稳定性和迭代效率,通过技术架构优化、流程标准化、工具能力升级,系统性提升算法策略的研发效率、上线速度与迭代质量,支撑业务策略快速落地与效果迭代,保障策略全生命周期的高效管理与稳定运行; 3、联动算法、工程、业务等相关团队,精准对齐策略平台建设需求,推动策略平台的应用落地与持续优化,输出策略平台使用指南与技术支持,提升团队平台使用效率; 4、持续优化策略迭代流程,通过工具化、自动化、智能化能力建设,降低算法研发与策略落地的工程成本,解决平台运行中的核心技术瓶颈; 5、跟踪行业前沿技术与策略平台建设趋势(如大模型与策略平台融合、自动化机器学习等),引入适配业务的技术方案,推动策略平台技术能力持续领先;

更新于 2026-02-02
logo of xiaohongshu
社招1年以上后端开发

小红书基础设施网络平台致力于实现网络监管控的平台化,自动化,智能化。建设多场景、高可用、高性能可观测系统。覆盖设备基础监控,流量分析,云网络,拨测,内网质量等多种场景。

北京|上海|杭州
logo of tencent
社招5年以上腾讯云技术

1.负责腾讯云大数据基础运维和客户问题解决,基于腾讯云提供的EMR、Elasticsearch、TCHouse产品,解决客户在产品使用过程中遇到的问题,为客户业务提供最佳服务体验; 2.负责报障大数据产品服务稳定性,包括全局数智化监控、服务架构容灾、容量管理等基础运维能力建设,保障大数据服务SLA; 3.负责运维标准流程规范制定,建设大数据产品运维标准、大数据产品规范化变更流程和大数据组件可观测性标准等; 4.参与智能化运维AIOps,对标互联网SRE业界优秀经验,基于自研运维平台,实现智能化运维,提升运维效率。

更新于 2025-08-05上海