logo of kuaishou

快手大数据运维产品开发工程师/专家

社招全职3年以上D7209地点:北京状态:招聘

任职要求


1、三年及以上Java开发经验,有扎实的计算机基础知识和编程功底; 
2、精通多线程编程,熟悉JVM,熟悉常见的开源分布式中间件缓存消息队列等,有分布式系统设计相关经验,熟悉MySQL,熟悉Linux下的DevOps; 
3、精通Spring MVCSpring boot编程;
4、熟悉大数据运维系统,有ambari或者其他运维系统使用与开发经验优先;
5、有基于k8s大数据运维系统使用与开发经验优先。

工作职责


1、参与快手大数据运维产品建设,包括大数据计算引擎运维平台与业务控制台开发落地,保障引擎运维效率以及提升业务使用计算引擎易用性;
2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 
3、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。
包括英文材料
Java+
多线程+
JVM+
中间件+
缓存+
消息队列+
分布式系统+
MySQL+
Linux+
DevOps+
Spring+
Spring Boot+
大数据+
Kubernetes+
相关职位

logo of kuaishou
社招3年以上D7209

1、负责公司数万节点大数据集群的各项运维管理工作,保障集群服务的高可用性运行; 2、负责超大规模集群服务运维管理平台的设计与研发工作,保障集群服务版本高速迭代以及变更的风险控制; 3、负责集群服务的监控报警体系规划与产品研发迭代,推进监控报警有效性与智能化; 4、负责集群服务容量规划、服务管理与治理规划与产品研发迭代工作。

更新于 2025-04-28
logo of tencent
社招5年以上腾讯云技术

1.负责腾讯云大数据基础运维和客户问题解决,基于腾讯云提供的EMR、Elasticsearch、TCHouse产品,解决客户在产品使用过程中遇到的问题,为客户业务提供最佳服务体验; 2.负责报障大数据产品服务稳定性,包括全局数智化监控、服务架构容灾、容量管理等基础运维能力建设,保障大数据服务SLA; 3.负责运维标准流程规范制定,建设大数据产品运维标准、大数据产品规范化变更流程和大数据组件可观测性标准等; 4.参与智能化运维AIOps,对标互联网SRE业界优秀经验,基于自研运维平台,实现智能化运维,提升运维效率。

更新于 2025-08-05
logo of alibaba
社招3年以上技术类-开发

1. 负责Accio AI产品的研发,包括需求分析,系统设计,用 AI IDE 写代码,编写单测,模块数据分析,监控运维等; 2. 能够进行技术攻坚,架构优化,性能优化,并能能够自驱定义问题,解决问题,追过程,拿结果; 3. 主观能动性好,能够持续学习,特别是 AI 技术的发展和落地应用,提升产品效果,工程效率,技术先进性。

更新于 2025-07-28
logo of xiaohongshu
社招1年以上后端开发

小红书基础设施网络平台致力于实现网络监管控的平台化,自动化,智能化。建设多场景、高可用、高性能可观测系统。覆盖设备基础监控,流量分析,云网络,拨测,内网质量等多种场景。