哔哩哔哩资深大数据架构工程师-平台工程方向
社招全职5年以上技术类地点:上海状态:招聘
任职要求
【硬性条件】 ●985 / 211 及以上院校全日制本科及以上学历,计算机相关专业 ●5 年以上大数据相关工作经验 ●至少深度参与过 1 个大型大数据基础设施项目(EB 级存储 / PB 级日处理 / 千节点以上集群 任一) ●Java / Scala / Go / Rust / C++ 中至少两门掌握扎实 ●深度参与过大型数据平台 / 集群管理 / 运维体系(任一)的研发,服务过 >= 千节点 / >= 万级任务量 ●熟练掌握 K8s(部署、Operator、调度、网络、存储)和 CI/CD(GitLab CI / Jenkins / Argo CD 等) 【能力素质(满足一项或多项)】 ●对分布式系统、配置管理、可观测性有体系化认知 ●主导过大数据组件在 K8s 上的容器化改造与落地(Spark on K8s / Flink K8s Operator 等) …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
一、平台工程方向(集群管理 / 组件发布 / 运维诊断 / 资源治理) 1、主导大数据集群管理平台建设,支撑全公司万级节点、十数套核心组件的生命周期管理,包括但不限于: (1)集群部署 / 扩缩容 / 滚动升级 (2)多集群、多机房统一管控 (3)配置中心、灰度发布、版本管理 2、主导大数据组件的发布与持续交付体系,包括但不限于: (1)大数据组件(Hadoop / Spark / Flink / Kafka / ClickHouse 等)的 CI/CD 流水线建设 (2)自动化测试、变更影响分析、灰度策略、自动回滚 (3)内部分支管理与社区版本同步策略 3、主导大数据运维诊断体系建设,包括但不限于: (1)全栈可观测性(Metrics / Logs / Tracing / Profiling) (2)智能告警、根因分析、故障自愈 (3)慢任务 / 慢查询诊断、性能 profiling 自动化 4、主导大数据集群资源治理体系建设,包括但不限于: (1)多租户隔离、配额管理、弹性资源池 (2)资源利用率分析、成本核算、容量规划 (3)K8s / YARN 混部、潮汐调度、超卖与回收 5、推动 AI × 平台融合:智能资源调优、AI Agent 运维助手、对话式集群管理 二、AI 赋能基础设施研发 1、熟练使用 Claude Code、Cursor、Copilot 等 AI 编程工具 2、主导 AI 流程自动化建设,为团队赋能: (1)开发阶段:基于 AI 的代码生成、Code Review、单测生成、性能 profiling 自动化 (2)发布阶段:AI 辅助的变更影响分析、灰度策略推荐、回滚决策 (3)运维阶段:AI 驱动的告警归并、根因分析、故障自愈 (4)答疑阶段:基于内部知识库的 RAG 答疑机器人、SQL 助手、调优建议生成 3、沉淀 AI 工具链实践
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Rust+
https://www.youtube.com/watch?v=BpPEoZW5IiY
In this comprehensive Rust course for beginners, you will learn about the core concepts of the language and underlying mechanisms in theory.
https://www.youtube.com/watch?v=lzKeecy4OmQ
Full Rust 101 Crash Course for beginners.
https://www.youtube.com/watch?v=rQ_J9WH6CGk
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
CI+
https://www.ibm.com/cn-zh/think/topics/continuous-integration
持续集成 (CI) 是一种软件开发实践,开发人员在整个开发周期中会定期将新的代码和代码变更集成到中央代码存储库中。它是 DevOps 和敏捷方法的关键组成部分。
https://www.youtube.com/watch?v=42UP1fxi2SY
CD+
https://www.redhat.com/zh-cn/topics/devops/what-is-ci-cd
CI/CD 是持续集成和持续交付/部署的缩写,旨在简化并加快软件开发生命周期。
https://www.youtube.com/watch?v=R8_veQiYBjI&list=PLy7NrYWoggjzSIlwxeBbcgfAdYoxCIrM2
GitLab+
https://docs.gitlab.com/tutorials/
Learn about GitLab fundamentals by following guided instructions.
还有更多 •••