字节跳动大数据计算引擎开发工程师-数据平台
校招全职A58657地点:北京状态:招聘
任职要求
1、2026届获得本科及以上学历,计算机相关专业优先; 2、熟练掌握Java或C++编程,具备扎实的计算机基础知识(包含数据结构、算法、多线程编程、I/O、操作系统等); 3、熟悉Spark、Doris、StarRocks、Presto、Kylin、…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等; 2、参与以Spark、Doris、Presto、Ray、Lance等为代表的大数据引擎内核优化; 3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发; 4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
多线程+
https://liaoxuefeng.com/books/java/threading/basic/index.html
和单线程相比,多线程编程的特点在于:多线程经常需要读写共享数据,并且需要同步。
https://www.youtube.com/watch?v=_uQgGS_VIXM&list=PLsc-VaxfZl4do3Etp_xQ0aQBoC-x5BIgJ
https://www.youtube.com/watch?v=IEEhzQoKtQU
https://www.youtube.com/watch?v=mTGdtC9f4EU&list=PLL8woMHwr36EDxjUoCzboZjedsnhLP1j4
https://www.youtube.com/watch?v=TPVH_coGAQs&list=PLk6CEY9XxSIAeK-EAh3hB4fgNvYkYmghp
https://www.youtube.com/watch?v=xPqnoB2hjjA
This video is an introduction to multithreading in modern C++.
https://www.youtube.com/watch?v=YKBwKy5PrpQ
Rust threading is easy to implement and improves the efficiency of your applications on multi-core systems!
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Doris+
https://doris.apache.org/docs/gettingStarted/what-is-apache-doris
StarRocks+
https://docs.starrocks.io/docs/quick_start/
These Quick Start guides will help you get going with a small StarRocks environment.
https://itnext.io/introduction-to-starrocks-a-new-modern-analytical-database-1db2177d26e1
Recently, I had the opportunity to explore StarRocks which is the new kid in the block when talking about massive scale databases which are able to handle petabytes of data.
还有更多 •••
相关职位
校招数据引擎
【业务介绍】 数据引擎是大数据Infra团队,提供大数据存储、计算、平台基础能力,支持EB级别数据的实时集成、开发加工、消费使用的全链路数据解决方案。 【职位描述】 1. 负责大数据计算引擎以及数据平台的研发工作,支撑公司内社区、电商以及商业化业务; 2. 面向PB级海量数据的解决方案设计,处理每日千亿级增量的用户行为数据; 3. 通过提供优秀的引擎和平台产品,配合数据产品及数据仓库团队,建设高效的数据研发体系,提供高效稳定的数据服务,降低数据的使用门槛,实现数据的最大价值。
北京|上海
社招3年以上火车票业务开发
1.负责指标平台、用户画像平台等数据平台的后端服务与数据查询接口研发与优化。 2.参与画像标签的生产、同步与维护,保证标签口径统一与数据的准确、及时。 3.支撑数据产品版本迭代,按需求完成功能新增、性能优化、监控与日志补全等工作。 4.配合算法团队,参与在线推荐服务的接口与数据链路开发,保障在线服务结果的稳定、高效输出。 5.参与大模型相关探索,如指标助手、图文生成等大模型应用,以及MCP等框架的数据接口开发与接入。 6.跟踪业界大数据和实时计算技术发展,评估并引入合适的新技术方案,持续优化平台架构与研发效率。 7.积极响应线上问题,对数据查询、平台任务故障等问题进行快速排查与修复,保障数据平台高可用与稳定运行。
更新于 2025-12-02上海
社招3年以上D7209
1、参与快手大数据运维产品建设,包括大数据计算引擎运维平台与业务控制台开发落地,保障引擎运维效率以及提升业务使用计算引擎易用性; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。
更新于 2025-03-07北京