logo of aliyun

阿里云诚云科技-资深应用运维工程师-开源大数据平台

社招全职3年以上诚云科技地点:北京 | 杭州状态:招聘

任职要求


1、有K8S/主流开源大数据大数据引擎(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)的运维经验,熟悉分布式系统原理及Linux原理
2、熟悉Golang/Python/Java至少一门编程语言,有运维平台开发建设经验,如有AIOps智能运维经验是加分项
3、要具备稳定性安全生产落地实战经验,包括高可用架构、可观测性&监控、异常处置、SLA&可用率、节点自愈等
4、有良好沟通及项目推动协作能力,做事严谨仔细、具备较好韧性

工作职责


1、负责阿里云开源大数据平台(Flink/EMR/Spark/StarRocks/ES/Hadoop/K8S)运维工作,包括可观测性链路、监控报警,故障应急及处置、SLA可用率度量提升等
2、研发大数据运维管控平台,通过自动化提升运维效率,包括交付&变更CICD、智能诊断定界等
3、落地AIOps智能运维,通过AI算法提升稳定性,包括异常检测、根因定位及基于大模型&智能体Agent运维落地等
4、负责稳定性架构设计及项目组织推动落地,包括基础架构云原生化、跨AZ高可用架构、产品可运维性架构演进等
包括英文材料
Kubernetes+
大数据+
Spark+
StarRocks+
ElasticSearch+
Hadoop+
分布式系统+
Linux+
Go+
Python+
Java+
高可用+
相关职位

logo of aliyun
社招3年以上诚云科技

ꔷ 主导疑难问题工单的分析与解决,保障客户核心业务稳定运行; ꔷ 参与客户业务重保(Critical Support)方案设计与执行,提升客户满意度。 用户体验优化与产品改进 ꔷ 从工单中定位产品缺陷,提炼用户需求,提出优化建议; ꔷ 推动产品质量与功能迭代,通过技术改进提升用户体验。 运维平台智能化建设 ꔷ 参与大数据运维平台的产品化及智能化升级,主导售后工具、运维平台的开发与优化; ꔷ 基于历史工单数据、开源社区知识库,结合 MCP、RAG 等大模型技术,构建智能运维体系,提升售后响应效率与问题解决能力。 运维服务体系建设 ꔷ 负责运维服务体系的规划与落地,包括团队生态人员招聘、技能培养及知识沉淀; ꔷ 制定运维能力提升计划,确保团队高效支持复杂场景

更新于 2025-08-04
logo of hello
社招3-5年技术

1. 系统开发与实现:依据风控平台的业务需求,负责核心模块的代码编写,涵盖风险评估、预警规则设定、用户行为分析等功能的具体实现,确保代码的质量和可维护性;运用 Java 相关技术,如 Spring Boot、Spring Cloud 等框架,搭建稳定、高效的系统架构,保障平台在高并发、大数据量环境下的稳定运行 。 2. 数据处理与算法应用:参与处理和分析海量的风险数据,包括用户交易数据、信用数据等,借助数据挖掘算法和机器学习技术,构建风险预测模型,为风险评估和控制提供数据支持;优化现有算法,提升风险识别的准确性和及时性,降低误判率 。 3. 技术协作与沟通:与产品团队紧密合作,理解业务需求,将其转化为可行的技术方案;协同测试团队,进行联调测试,及时解决测试过程中发现的问题,保障系统的稳定性和可靠性;与运维团队协作,协助完成系统的部署、监控和维护工作,确保系统的持续稳定运行 。 4. 问题解决与优化:实时监控风控平台的运行状态,快速定位并解决系统出现的故障和性能瓶颈,如响应延迟、数据异常等问题;根据业务发展和用户反馈,持续对系统进行优化和升级,提升系统的性能和用户体验 。

更新于 2025-05-16
logo of meituan
社招3年以上金融服务平台

1. 负责为美团金服销售业务建设稳定高可用的系统,能支撑业务快速变化,业务量高速增长;(业务支撑) 2. 面对信贷账户的业务规模,从整体上规划系统的容量、稳定性,制定有效的技术解决方案和迭代计划,持续提升系统的高并发、高可用、扩展性、资金安全处理能力; 3. 主动发现和分析产品存在的用户痛点和技术问题,提出全链路可行的改进方案,并能推动业务、产品、研发多方合作落地实施; 4. 指导初级工程师,提高团队技术能力及战斗力;

更新于 2025-06-22
logo of meituan
社招3年以上金融服务平台

1. 负责美团金服信贷业务建设稳定高可用的系统,能支撑业务快速变化,业务量高速增长;(业务支撑) 2. 面对信贷账户的业务规模,从整体上规划系统的容量、稳定性,制定有效的技术解决方案和迭代计划,持续提升系统的高并发、高可用、扩展性、资金安全处理能力; 3. 主动发现和分析产品存在的用户痛点和技术问题,提出全链路可行的改进方案,并能推动业务、产品、研发多方合作落地实施; 4. 指导初级工程师,提高团队技术能力及战斗力;

更新于 2025-07-23