logo of bytedance

字节跳动大数据计算引擎开发工程师-数据平台

校招全职A58657地点:北京状态:招聘

任职要求


1、2026届获得本科及以上学历,计算机相关专业优先;
2、熟练掌握JavaC++编程,具备扎实的计算机基础知识(包含数据结构算法多线程编程、I/O、操作系统等);
3、熟悉SparkDorisStarRocks、Presto、Kylin、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。

1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等;
2、参与以Spark、Doris、Presto、Ray、Lance等为代表的大数据引擎内核优化;
3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发;
4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
包括英文材料
学历+
Java+
C+++
数据结构+
算法+
多线程+
Spark+
Doris+
StarRocks+
还有更多 •••
相关职位

logo of ctrip
社招3年以上火车票业务开发

1.负责指标平台、用户画像平台等数据平台的后端服务与数据查询接口研发与优化。 2.参与画像标签的生产、同步与维护,保证标签口径统一与数据的准确、及时。 3.支撑数据产品版本迭代,按需求完成功能新增、性能优化、监控与日志补全等工作。 4.配合算法团队,参与在线推荐服务的接口与数据链路开发,保障在线服务结果的稳定、高效输出。 5.参与大模型相关探索,如指标助手、图文生成等大模型应用,以及MCP等框架的数据接口开发与接入。 6.跟踪业界大数据和实时计算技术发展,评估并引入合适的新技术方案,持续优化平台架构与研发效率。 7.积极响应线上问题,对数据查询、平台任务故障等问题进行快速排查与修复,保障数据平台高可用与稳定运行。

更新于 2025-12-02上海
logo of kuaishou
社招3年以上D7209

1、参与快手大数据运维产品建设,包括大数据计算引擎运维平台与业务控制台开发落地,保障引擎运维效率以及提升业务使用计算引擎易用性; 2、接受大数据平台系统设计与实现复杂度的挑战,分析和发现系统的优化点,负责推动系统的合理性、可靠性、可用性的提升; 3、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。

更新于 2025-03-07北京
logo of kuaishou
社招3年以上D11431

1、参与公司大数据开发与管理平台、数据资产及营销平台的研发工作,包括大数据开发平台、质量平台、安全中心、数据资产平台、营销平台等; 2、充分利用大数据技术、微服务、分布式系统等技术,构建高可用、高扩展和低耦合高内聚的数据中台服务; 3、熟悉业界技术体系,为快手数据产品研发引入创造性的技术方案,解决面临的各种复杂问题和挑战。

更新于 2024-10-10北京
logo of youzan
社招

我们是有赞的核心数据团队,主要负责商家后台数据中心的建设与运营。我们致力于打造业界领先的、基于语义层的统一数据服务平台(OneService),构建完善的指标管理体系,赋能商家精细化运营,提升数据驱动决策的效率。加入我们,你将有机会参与从0到1或从1到N构建企业级数据服务核心基础设施的过程。 岗位职责: 1. 负责统一数据服务平台(基于语义层)的设计、研发与持续优化,打造公司级标准、高效、易用的数据消费入口; 2. 负责指标中心/指标管理系统的规划与建设,建立规范化的指标生产、维护、管理流程与配套工具,保障指标口径统一与准确; 3. 提升平台数据服务能力,支持多样化的数据消费场景(如:BI报表、自助分析、数据API、运营活动等),赋能业务实现数据驱动,包括但不限于数据可视化产品,数据赋能运营等场景的设计和落地; 4. 持续优化数据平台的技术架构,提升系统稳定性、查询性能和用户体验,降低数据接入和使用成本; 5. 负责数据产品的开发及维护工作,与数据分析师、产品经理、业务方紧密合作,理解数据需求,将其转化为标准化的数据平台能力。 工作内容: 1. 负责商家数据中心的设计、开发与持续迭代优化(基于离线/实时数仓); 2. 深入参与OneService平台的设计与研发,包括但不限于语义层建模、查询引擎对接、API服务开发、权限管理等核心模块; 3. 负责指标维度管理系统的设计与实现,支持指标的定义、血缘、变更、生命周期管理等功能; 4. 基于Spark/Flink等计算引擎进行数据处理、加工与分析,构建高效、稳定的数据链路; 5. 应用OLAP技术(如Doris, ClickHouse, Kylin等)优化海量数据查询性能,并根据业务场景进行技术选型和实践; 6. 参与数据服务相关在线系统的架构设计与开发,保障服务的高可用和高性能。

更新于 2025-03-28杭州