logo of bytedance

字节跳动大数据计算引擎开发工程师-数据平台

校招全职A58657地点:北京状态:招聘

任职要求


1、2026届获得本科及以上学历,计算机相关专业优先;
2、熟练掌握JavaC++编程,具备扎实的计算机基础知识(包含数据结构算法多线程编程、I/O、操作系统等);
3、熟悉SparkDorisStarRocksPresto、Kylin、HiveImpalaFlinkClickHouseRay、Lance、Paimon、IcebergHudi等主流大数据系统原理及源码优先;
4、熟悉主流的OLAP引擎的优化原理,如CBO、向量化执行、物化视图、列式存储、Shuffle优化等。

工作职责


团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。

1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等;
2、参与以Spark、Doris、Presto、Ray、Lance等为代表的大数据引擎内核优化;
3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发;
4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
包括英文材料
学历+
Java+
C+++
数据结构+
算法+
多线程+
Spark+
Doris+
StarRocks+
Presto+
Hive+
Impala+
ClickHouse+
Ray+
Iceberg+
Hudi+
OLAP+
相关职位

logo of xiaohongshu
校招数据引擎

【业务介绍】 数据引擎是大数据Infra团队,提供大数据存储、计算、平台基础能力,支持EB级别数据的实时集成、开发加工、消费使用的全链路数据解决方案。 【职位描述】 1. 负责大数据计算引擎以及数据平台的研发工作,支撑公司内社区、电商以及商业化业务; 2. 面向PB级海量数据的解决方案设计,处理每日千亿级增量的用户行为数据; 3. 通过提供优秀的引擎和平台产品,配合数据产品及数据仓库团队,建设高效的数据研发体系,提供高效稳定的数据服务,降低数据的使用门槛,实现数据的最大价值。

logo of kuaishou
社招3年以上D7209

1、参与快手大数据运维产品建设,包括大数据计算引擎运维平台与业务控制台开发落地,保障引擎运维效率以及提升业务使用计算引擎易用性; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。

更新于 2025-03-07
logo of kuaishou
社招3年以上D11431

1、参与公司大数据开发与管理平台、数据资产及营销平台的研发工作,包括大数据开发平台、质量平台、安全中心、数据资产平台、营销平台等; 2、充分利用大数据技术、微服务、分布式系统等技术,构建高可用、高扩展和低耦合高内聚的数据中台服务; 3、熟悉业界技术体系,为快手数据产品研发引入创造性的技术方案,解决面临的各种复杂问题和挑战。

更新于 2024-10-10
logo of quark
社招3年以上技术类-开发

1、分布式 NoSQL 存储架构设计与优化:负责大规模分布式 NoSQL存储系统的架构设计、核心模块开发及性能调优,支持 PB 级数据存储需求。 2、实现多租户资源隔离、优先级调度与 SLA 保障,支撑智能信息搜索/推荐/LLM 等高性能业务场景。 3、大数据计算引擎研发与优化:设计并开发流、批计算框架,构建基于 DAG 的动态任务调度系统,实现万级并发任务的资源利用率与 SLA 平衡。 4、攻克每日 PB 级流、批数据处理的稳定性挑战,优化大规模 Join/Aggregation 场景下的 IO 与网络带宽瓶颈。

更新于 2025-09-08