字节跳动大数据计算引擎开发工程师-数据平台
任职要求
1、2026届获得本科及以上学历,计算机相关专业优先; 2、熟练掌握Java或C++编程,具备扎实的计算机基础知识(包含数据结构、算法、多线程编程、I/O、操作系统等); 3、熟悉Spark、Doris、StarRocks、Presto、Kylin、…
工作职责
团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等; 2、参与以Spark、Doris、Presto、Ray、Lance等为代表的大数据引擎内核优化; 3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发; 4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
1、参与公司大数据平台架构的设计、优化与研发工作,涵盖 Spark、Hadoop、HBase、Iceberg 等核心组件 2、根据业务需求,设计高可用、高扩展性、高性能的大数据计算方案 3、参与 Iceberg 数据湖表的架构设计、规范制定与性能调优 4、参与 HBase 集群规划、表设计、预分区策略、热点优化及日常运维支持 5、参与 Spark 作业调优、资源管理与作业框架建设,提升整体计算稳定性与效率 6、配合团队进行 Hadoop 平台建设、集群管理、版本升级与安全策略落地 7、跟踪大数据技术前沿,结合业务场景进行技术预研和落地。
1、参与快手大数据运维产品建设,包括大数据计算引擎运维平台与业务控制台开发落地,保障引擎运维效率以及提升业务使用计算引擎易用性; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。
1、参与公司大数据开发与管理平台、数据资产及营销平台的研发工作,包括大数据开发平台、质量平台、安全中心、数据资产平台、营销平台等; 2、充分利用大数据技术、微服务、分布式系统等技术,构建高可用、高扩展和低耦合高内聚的数据中台服务; 3、熟悉业界技术体系,为快手数据产品研发引入创造性的技术方案,解决面临的各种复杂问题和挑战。

我们是有赞的核心数据团队,主要负责商家后台数据中心的建设与运营。我们致力于打造业界领先的、基于语义层的统一数据服务平台(OneService),构建完善的指标管理体系,赋能商家精细化运营,提升数据驱动决策的效率。加入我们,你将有机会参与从0到1或从1到N构建企业级数据服务核心基础设施的过程。 岗位职责: 1. 负责统一数据服务平台(基于语义层)的设计、研发与持续优化,打造公司级标准、高效、易用的数据消费入口; 2. 负责指标中心/指标管理系统的规划与建设,建立规范化的指标生产、维护、管理流程与配套工具,保障指标口径统一与准确; 3. 提升平台数据服务能力,支持多样化的数据消费场景(如:BI报表、自助分析、数据API、运营活动等),赋能业务实现数据驱动,包括但不限于数据可视化产品,数据赋能运营等场景的设计和落地; 4. 持续优化数据平台的技术架构,提升系统稳定性、查询性能和用户体验,降低数据接入和使用成本; 5. 负责数据产品的开发及维护工作,与数据分析师、产品经理、业务方紧密合作,理解数据需求,将其转化为标准化的数据平台能力。 工作内容: 1. 负责商家数据中心的设计、开发与持续迭代优化(基于离线/实时数仓); 2. 深入参与OneService平台的设计与研发,包括但不限于语义层建模、查询引擎对接、API服务开发、权限管理等核心模块; 3. 负责指标维度管理系统的设计与实现,支持指标的定义、血缘、变更、生命周期管理等功能; 4. 基于Spark/Flink等计算引擎进行数据处理、加工与分析,构建高效、稳定的数据链路; 5. 应用OLAP技术(如Doris, ClickHouse, Kylin等)优化海量数据查询性能,并根据业务场景进行技术选型和实践; 6. 参与数据服务相关在线系统的架构设计与开发,保障服务的高可用和高性能。