哔哩哔哩资深大数据架构工程师-离线计算方向

社招全职5年以上技术类2026-07-01地点：上海状态：招聘

扫码手机上打开

任职要求

【硬性条件】
●985 / 211 及以上院校全日制本科及以上学历，计算机相关专业
●5 年以上大数据相关工作经验
●至少深度参与过 1 个大型大数据基础设施项目（EB 级存储 / PB 级日处理 / 千节点以上集群 任一）
●Java / Scala / Go / Rust / C++ 中至少两门掌握扎实
●深度参与过 Spark 生产环境(>= PB / 日)的运维和优化,对 Spark 内核源码有源码级理解
●对至少一个领域有体系化认知:Catalyst 优化器 / Tungsten / Shuffle / Spark on K8s

 【加分项】
● 对开源生态高度熟悉
● 具备从 0 到 1 设计大型分布式系统的能力,能独立 owner 某个技术方向
● 良好的工程品味:代码质量、测试覆盖、可观测性、稳定性
● 熟练使用 AI 编程工具完成日常开发,对 LLM 能力边界有…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

一、离线计算方向(Spark / 向量化执行引擎)
1、跟踪 Spark / MapReduce / 向量化执行引擎(Gluten / Velox / Photon / DuckDB)的社区前沿,结合 bilibili 业务做选型和落地
2、主导 Spark 引擎在 PB 级日处理、千节点集群下的稳定性、性能优化,包括但不限于:
（1）Catalyst 优化器改造
（2）Shuffle 优化(Remote Shuffle Service / Celeborn / Magnet)
（3）AQE / Dynamic Allocation / Spec Execution 深度调优
3、推动 Spark 与向量化引擎(Gluten + Velox)的深度集成,降低 CPU 成本、提升查询性能
4、解决批处理任务的资源效率、SQL 兼容性、调度延迟等真实工程问题
5、与湖仓团队配合,做好 Spark on Iceberg / Paimon 的查询和写入优化

二、AI 赋能基础设施研发
1、熟练使用 Claude Code、Cursor、Copilot 等 AI 编程工具，将 AI 深度嵌入日常工作流
2、主导 AI 流程自动化建设，为团队赋能： 
（1）开发阶段：基于 AI 的代码生成、Code Review、单测生成、性能 profiling 自动化
（2）发布阶段：AI 辅助的变更影响分析、灰度策略推荐、回滚决策
（3）运维阶段：AI 驱动的告警归并、根因分析、故障自愈
（4）答疑阶段：基于内部知识库的 RAG 答疑机器人、SQL 助手、调优建议生成
3、沉淀 AI 工具链最佳实践，推广到全组并向外辐射

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大数据+

Java+

Scala+

Go+

Rust+

C+++

Spark+

还有更多 •••

登录查看完整学习资料