logo of bytedance

字节跳动实时数仓存储专家

社招全职A55693地点:杭州状态:招聘

任职要求


1、具备良好的 Java / Scala 编程基础和良好的计算机技术基础,同时具备良好的沟通能力和团队协作能力;
2、熟悉 KafkaPulsar,Pravega 等开源实时存…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


数据引擎-存储引擎团队,负责自研实时数仓存储服务的研发,实现一份存储同时满足流计算、批计算、交互式分析、点查等多种场景。团队内部有多名 Apache Committer,在国内外有较强的技术影响力,与众多优秀的大数据计算、存储领域专家一起合作,一起打造业界领先实时数仓存储服务。

职位描述:
1、打造业界领先的流批一体实时数仓存储服务,支撑支撑字节跳动众多核心业务线(如抖音,今日头条,电商);
2、负责消息存储引擎、KV 存储引擎等核心组件的内核研发;
3、负责实时数仓存储的生态研发,与 Flink,Presto,Spark 等计算引擎深度结合。
包括英文材料
Java+
Scala+
Kafka+
Pulsar+
HBase+
还有更多 •••
相关职位

logo of dewu
社招3年以上技术类

1. 核心系统构建: 负责设计与搭建基于 Flink 的实时特征计算平台,保障其高可用、低延迟和高吞吐量。 2. 实时数仓与建模: 负责用户/item特征实时数仓的层次设计、模型开发与优化,构建主题明确、数据可信、易于复用的实时数据模型,为用户/物料特征计算提供高质量数据支撑。 3. 实时特征工程: 开发并优化实时特征管道(Feature Pipeline),包括行为序列、滑动窗口聚合、多流关联等复杂实时特征的加工与存储,为搜推模型提供高质量数据输入。 4. 平台保障与优化: 负责实时数据从接入、处理到输出全链路的稳定性保障、性能调优(如解决数据倾斜、反压问题)和故障排查,确保7x24小时服务稳定。 5. 技术演进: 研究并引入业界先进的流处理技术,解决超大数据量下的状态管理、窗口计算、精确一次语义(Exactly-Once)等技术挑战,推动平台技术架构持续演进。

更新于 2025-10-20北京|上海
logo of baidu
社招8年以上ACG

-根据市场需求和公司战略,制定数据仓库产品的长期发展规划和短期实施计划 -引导团队探索并应用最新的数据仓库技术,不断优化产品,提升用户体验 -负责项目的整体规划、执行监控及风险管理,确保项目按时按质完成 -设定数据仓库技术的长远发展方向,保持公司在行业内的技术领先地位

更新于 2024-07-19北京
logo of didi
社招5年以上技术

国际化外卖-配送策略架构方向, 为外卖配送提供了特征数据服务、策略工程和地理围栏等业务核心能力; 技术上包括了分布式存储框架,特征工程,策略模型架构等方向, 涉及流式计算框架、资源调度平台、特征工程,内存存储引擎研发等工作, 具备较强的业务效果要求和技术深度挑战;

更新于 2025-09-19北京
logo of amap
社招3年以上技术类-数据

1. 建设PB级数据仓库,参与或负责数据仓库设计、建模、数据管理等 2. 参与或负责高德地图业务支撑系统数据平台相关数据开发和管理工作,如研发、质量、保障等规范的制定与实施落地 3. 参与导航体系和用户增值体系的核心业务,深入业务负责应用数据构建和指标体系构建以及业务数据分析&挖掘 4. 支持各个业务的基础层数据建设工作,支持公司的BI指标&算法应用等场景 将会接触到高德的轨迹大数据是万亿级别的,覆盖的场景也特别丰富,驾车、骑行、步行、日常的各类行为及定位等业务内容。

更新于 2025-11-04北京