得物数据湖格式引擎研发专家

社招全职5年以上技术类2025-07-08地点：上海 | 杭州状态：招聘

扫码手机上打开

任职要求

【工程能力】扎实的计算机理论基础，精通Java/Scala开发（含并发编程/JVM原理/设计模式），追求卓越工程品质，具备出色的Debug与性能分析能力；
【领域能力】精通Java/Scala/C++任一语言，5年以上大数据系统研发经验（其中2年以上存储引擎开…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

【核心技术研发】主导数据湖格式引擎（Iceberg/Hudi/Delta Lake/Paimon）内核开发与性能调优，构建支持批流一体与高效增量处理的技术体系；
【业务支撑】主导生产集群疑难问题诊断与根因分析，协同运维保障平台高可用性，提供业务方全链路大数据平台使用支持；
【平台规划】参与计算平台技术架构演进设计，提升湖仓一体能力，基于云原生IAAS或自建IAAS构建高可靠、高性能、低成本的计算基础设施；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Java+

Scala+

JVM+

设计模式+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

数据湖存储专家-Hudi

社招Y8213

数据引擎-数据湖团队，旨在打造业界领先的 EB 级超大规模数据湖，支持字节跳动众多业务线，如抖音、今日头条、电商。同时基于内部最佳实践，在火山引擎上打造一款云原生实时湖仓一体的 toB 产品——湖仓一体分析服务LAS（LakeHouse Analytics Service）。职位描述： 1、打造业界领先的基于 HUDI 构建的 EB 级湖仓一体解决方案，支撑字节跳动众多核心业务线（如抖音，今日头条，电商）和 ToB 业务； 2、负责围绕数据湖构建一站式全托管优化服务，数据湖内核的极致优化，以及流批一体的数据湖加速层的设计与研发； 3、负责数据湖存储的生态研发，与 Spark、Flink、Presto、Hive 等计算引擎深度结合； 4、与开源社区紧密合作，持续构建开源影响力，有机会成长为 HUDI committer / PMC。

更新于 2023-03-06杭州

蚂蚁集团-蚂蚁数据湖存储专家-杭州/上海【数据平台】

社招5年以上技术-基础平台

⁃ 解决千亿级元数据索引效率的问题，支撑海量文件的查询访问效率以及元数据扩展性问题，提供性能卓越扩展良好的元数据服务。 ⁃ 高效的blob存储格式，编写高质量、可扩展、高可用、性能卓越的存储底层核心模块，对模块质量负责。 ⁃ 负责性能IO链路，对小文件聚合、大文件切片、EC编码等核心功能负责。 ⁃ 基于业界主流的AI训练加速方案，打造符合蚂蚁特点的高性能AI存储/缓存产品，为大模型、海量多模态数据的高并发训练提供存储底座，为AI算力持续增长提供基础设施侧保障。 ⁃ 负责存储产品的长期技术演进及稳定性保障，对上层业务效果负责。

更新于 2025-12-03杭州|上海

数据湖存储专家-Hudi

社招R9882

1、打造业界领先的基于HUDI构建的EB级湖仓一体解决方案，支撑字节跳动众多核心业务线（如抖音，今日头条，电商）和ToB业务； 2、负责围绕数据湖构建一站式全托管优化服务，数据湖内核的极致优化，以及流批一体的数据湖加速层的设计与研发； 3、负责数据湖存储的生态研发，与Spark、Flink、Presto、Hive等计算引擎深度结合； 4、与开源社区紧密合作，持续构建开源影响力，有机会成长为HUDI Committer/PMC。

更新于 2023-03-06上海

智能湖仓研发工程师（深圳/上海/北京）

社招TEG技术

1.负责湖仓存储系统内核的极致优化，设计并实现异步湖仓智能优化模块，提升数据写入/查询性能与资源利用率； 2.生态对接与计算融合：深度整合 Spark、Flink、SR 等计算引擎，实现湖仓与流批一体场景的平滑对接，支持实时数仓与离线分析协同； 3.开源协同与技术影响力：参与 Iceberg 等开源项目贡献，主导定制化功能开发，推动技术文档完善与社区生态共建。

更新于 2025-05-26深圳