字节跳动大数据引擎开发实习生-数据平台
任职要求
1、2026届本科及以上学历在读,计算机相关专业优先; 2、熟练掌握Java或C++编程,具备扎实的计算机基础知识(包含数据结构、算法、多线程编程、I/O、操作系统等); 3、熟悉Spark、Doris、Presto、Kylin、Hive、Impala、Flink、ClickHouse等主流大数据系统原理及源码优先; 4、熟悉主流的OLAP引擎的优化原理,如CBO、向量化执行、物化视图、列式存储、Shuffle优化等。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:数据平台是字节跳动数据中台部门,横向支持公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也在致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等; 2、参与以Spark、Doris、Presto等为代表的大数据引擎内核优化; 3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发; 4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节数据BP团队以数据高效赋能业务为使命,在字节内部深入各业务线,以数据建设为基础,业务目标为导向,提供专业,稳定,高效的数据服务和架构方案。 1、参与字节跳动参与短视频、电商、直播等业务实时数据仓库建设工作; 2、面向PB级超大规模数据问题,每天处理千亿增量的用户行为数据; 3、为大数据的全生命周期提供服务,覆盖数据产生,传输,建模,统计分析,实验评估,可视化的全流程; 4、构建设计良好的数据流、数据仓库、调度系统、查询引擎,数据服务、分析系统、流程规范,数据工具/产品,降低数据的使用门槛,保证系统稳定高效运行,以实现数据的最大价值。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节数据BP团队以数据高效赋能业务为使命,在字节内部深入各业务线,以数据建设为基础,业务目标为导向,提供专业,稳定,高效的数据服务和架构方案。 1、参与字节跳动抖音、直播、番茄小说等业务离线和实时数据仓库建设工作; 2、面向PB级超大规模数据问题,每天处理千亿增量的用户行为数据; 3、为大数据的全生命周期提供服务,覆盖数据产生,传输,建模,统计分析,实验评估,可视化的全流程; 4、构建设计良好的数据流、数据仓库、调度系统、查询引擎,数据服务、分析系统、流程规范,数据工具/产品,降低数据的使用门槛,保证系统稳定高效运行,以实现数据的最大价值。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节数据BP团队以数据高效赋能业务为使命,在字节内部深入各业务线,以数据建设为基础,业务目标为导向,提供专业,稳定,高效的数据服务和架构方案。 1、参与字节跳动国际化电商业务离线和实时数据仓库建设工作; 2、面向PB级超大规模数据问题,每天处理千亿增量的用户行为数据; 3、为大数据的全生命周期提供服务,覆盖数据产生,传输,建模,统计分析,实验评估,可视化的全流程; 4、构建设计良好的数据流、数据仓库、调度系统、查询引擎,数据服务、分析系统、流程规范,数据工具/产品,降低数据的使用门槛,保证系统稳定高效运行,以实现数据的最大价值。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节数据BP团队以数据高效赋能业务为使命,在字节内部深入各业务线,以数据建设为基础,业务目标为导向,提供专业,稳定,高效的数据服务和架构方案。 1、参与字节跳动抖音电商、生活服务等业务离线和实时数据仓库建设工作; 2、面向PB级超大规模数据问题,每天处理千亿增量的用户行为数据; 3、为大数据的全生命周期提供服务,覆盖数据产生,传输,建模,统计分析,实验评估,可视化的全流程; 4、构建设计良好的数据流、数据仓库、调度系统、查询引擎,数据服务、分析系统、流程规范,数据工具/产品,降低数据的使用门槛,保证系统稳定高效运行,以实现数据的最大价值。