logo of bytedance

字节跳动数据湖 高级工程师/技术专家

社招全职K4338地点:上海状态:招聘

任职要求


1、具备良好的 Java / Scala 编程基础和良好的计算机技术基础;
2、具备良好的沟通能力和团队协作能力;
3、熟悉开源数据湖存储方案 Hudi,Iceberg,Delta Lake 的原理及源码,有内核开发经验或社区贡献者优先,开源社区 committer / PMC 优先;
4、熟悉 KUDU,HBaseCassandra 等分布式存储系统,或者 SparkFlinkPrestoDorisHiveImpala 等主流大数据系统原理者优先。

工作职责


数据引擎-数据湖 团队,旨在打造业界领先的 EB 级超大规模数据湖,支持字节跳动众多核心业务线,如抖音、今日头条、电商。同时基于内部最佳实践,在火山引擎上打造一款云原生实时湖仓一体的 toB 产品——湖仓一体分析服务LAS(LakeHouse Analytics Service)。

1、打造业界领先的基于 HUDI的EB级数据湖,支撑字节跳动众多业务线(如抖音,今日头条,电商);
2、负责流批一体的实时数据湖存储系统的设计与研发,以及内核的极致优化;
3、与开源社区紧密合作,持续构建开源影响力,有机会成长为 HUDI Committer / PMC。
包括英文材料
Java+
Scala+
内核+
HBase+
Cassandra+
Spark+
Presto+
Doris+
Hive+
Impala+
相关职位

logo of ctrip
社招5年以上技术团队AI &

职位概述: 作为数据开发专家,您将负责设计、开发和维护数据仓库、数据湖和数据管道,确保数据的准确性、完整性和可访问性。您将与数据科学家、分析师和业务团队紧密合作,提供数据支持,推动数据驱动的决策和创新。 设计和实现高效的数据模型,支持复杂的数据查询和分析需求。 开发和维护数据集成和ETL(提取、转换、加载)流程。 优化数据存储解决方案,确保数据的安全性和合规性。 与跨职能团队合作,理解业务需求,提供定制化的数据解决方案。 监控数据质量,确保数据准确性和一致性。 跟踪和评估新兴的数据技术和工具,推动技术创新。 编写技术文档,为团队成员提供指导和培训。 管理数据项目的时间表和预算,确保按时交付高质量的成果。

更新于 2024-10-28
logo of aliyun
社招5年以上云智能集团

1. 作为企业客户技术服务工作的第一责任人,深入了解客户业务场景,与客户的架构、开发、运维团队深入合作,梳理分析客户现有云产品及应用架构,围绕企业客户上云、云上业务设计稳定性优化方案,从云上监控,主动发现,灾难演练,业务快恢/降级方案,高可用架构改造等方面协助客户持续优化云上稳定性。 2. 与阿里云各团队充分合作,从客户架构视角出发进行问题处置、护航保障、风险治理,并沉淀输出最佳实践及工具产品,面向客户痛点主动进行专项高阶服务。 3. 追踪客户关键稳定性问题,持续协助客户治理并不断推动阿里云产品及服务的优化改进。

更新于 2025-09-28
logo of bytedance
社招X9WV

1、为大规模推荐系统设计和实现合理的流式计算系统; 2、设计和实现灵活可扩展、稳定、高性能存储系统和计算模型; 3、生产系统的Trouble-shooting,设计和实现必要的机制和工具保障生产系统稳定运行; 4、打造业界领先的流式计算框架等分布式系统,为海量数据和大规模业务系统提供可靠的基础设施。

更新于 2021-12-31
logo of autohome
社招5-10年技术

1、开发维护实时湖仓引擎(Flink、Paimon),建设平台化能力,攻克在高并发、低延迟、海量数据处理等方面的关键技术难题,保障公司业务稳定高效运行。 2、规划构建一体化的 Data + AI 计算平台,实现数据与 AI 的深度融合,提升数据开发效率和数据价值。 3、结合技术发展趋势与业务需求,主导技术选型及技术路线规划,推动大数据平台能力达到行业领先水平。

更新于 2025-09-15