哔哩哔哩资深大数据架构工程师-OLAP引擎方向
社招全职5年以上技术类地点:上海状态:招聘
任职要求
【硬性条件】 ●985 / 211 及以上院校全日制本科及以上学历,计算机相关专业 ●5 年以上大数据相关工作经验 ●至少深度参与过 1 个大型大数据基础设施项目(EB 级存储 / PB 级日处理 / 千节点以上集群 任一) ●Java / Scala / Go / Rust / C++ 中至少两门掌握扎实 ●深度参与过 ClickHouse / Trino / Doris / StarRocks / ES 至少一种 OLAP 引擎在生产环境(>= PB)的运维和优化 【能力素质(满足一项或多项)】 ●对查询引擎核心机制有源码级理解(向量化执行、查询优化器、列存格式之一) ●有向量化执行引擎(Velox / Gluten / Photon / DuckDB)开发经验 ●主导过 OLAP 引擎与湖格式(Iceberg / Paimon)的对接优化 ● …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
一、OLAP 引擎方向(ClickHouse / Trino / 查询加速) 1、跟踪 OLAP 引擎社区前沿(ClickHouse / Trino / StarRocks / Doris / Presto / ES),结合 bilibili BI / 实时分析 / Ad-hoc 业务做选型 2、主导 ClickHouse / Trino 在 PB 级数据规模下的稳定性、性能优化,包括但不限于: (1)向量化执行、列存优化、Codegen (2)分布式查询计划、Join 算法选择、CBO 改进 (3)物化视图 / 缓存层 / 二级索引 3、推动 OLAP 引擎与湖仓(Iceberg / Paimon)的深度集成,做高效的湖上查询加速 4、解决高并发点查、复杂分析、AI 数据探索等真实查询场景的工程难题 5、与平台工程团队配合,做好 OLAP 引擎的多租户、资源隔离、SLA 保障 二、AI 赋能基础设施研发 1、熟练使用 Claude Code、Cursor、Copilot 等 AI 编程工具,将 AI 深度嵌入日常工作流 2、主导 AI 流程自动化建设,为团队赋能: (1)开发阶段:基于 AI 的代码生成、Code Review、单测生成、性能 profiling 自动化 (2)发布阶段:AI 辅助的变更影响分析、灰度策略推荐、回滚决策 (3)运维阶段:AI 驱动的告警归并、根因分析、故障自愈 (4)答疑阶段:基于内部知识库的 RAG 答疑机器人、SQL 助手、调优建议生成 3、沉淀 AI 工具链最佳实践,推广到全组并向外辐射
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Rust+
https://www.youtube.com/watch?v=BpPEoZW5IiY
In this comprehensive Rust course for beginners, you will learn about the core concepts of the language and underlying mechanisms in theory.
https://www.youtube.com/watch?v=lzKeecy4OmQ
Full Rust 101 Crash Course for beginners.
https://www.youtube.com/watch?v=rQ_J9WH6CGk
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
ClickHouse+
[英文] Advanced Tutorial
https://clickhouse.com/docs/tutorial
Learn how to ingest and query data in ClickHouse using the New York City taxi example dataset.
https://www.youtube.com/watch?v=FtoWGT7kS-c
ClickHouse is an open-source column-oriented DBMS for online analytical processing that allows users to generate analytical reports using SQL queries in real-time.
https://www.youtube.com/watch?v=Rhe-kUyrFUE&list=PL0Z2YDlm0b3gcY5R_MUo4fT5bPqUQ66ep
Doris+
https://doris.apache.org/docs/gettingStarted/what-is-apache-doris
还有更多 •••