logo of bytedance

字节跳动数据库开发工程师-数据平台

校招全职A143518地点:杭州状态:招聘

任职要求


1、2026届获得本科及以上学历,计算机相关专业优先;
2、熟练掌握JavaC++编程,具备扎实的计算机基础知识(包含数据结构算法多线程编程、I/O、操作系统等);
3、熟悉SparkDorisStarRocksPresto、Kylin、HiveImpalaFlinkClickHouseRay、Lance、Paimon、IcebergHudi等主流大数据系统原理及源码优先;
4、熟悉主流的OLAP引擎的优化原理,如CBO、向量化执行、物化视图、列式存储、Shuffle优化等。

工作职责


团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。

1、负责分布式数据库(云原生架构)设计实现,打造业界领先的数据库系统;
2、深入底层系统与引擎,解决大规模生产环境集群可用性和性能优化问题;
3、理解业务/云原生架构,从场景出发,从软硬一体设计出发,打造极致系统;
4、跟踪数据库前沿技术,挖掘/落地新技术的机会,包括新硬件,智能优化器,湖仓一体等;
5、探索和落地AI/LLM与数据库的融合方向,如多模态数据数据分析,AI驱动的数据库运维自动化,基于AI Agent的智能助手等。
包括英文材料
学历+
Java+
C+++
数据结构+
算法+
多线程+
Spark+
Doris+
StarRocks+
Presto+
Hive+
Impala+
ClickHouse+
Ray+
Iceberg+
Hudi+
OLAP+
相关职位

logo of transsion
社招

1. 全面负责AI算法数据生产工具的需求梳理、平台架构设计与开发,包括不限于音频、文本等数据类型; 2. 负责AI数据资产的数仓建设,包括标签体系设计、数据安全策略、数据查询获取等,和模型自动训练平台高效平稳对接; 3. 负责数据云服务系统的运维; 4. 与部门算法工程师,数据生产工程师配合,理解数据平台需求,完成项目升级开发; 5. 负责文档撰写、新开发人员的培训等团队建设工作。

更新于 2025-02-08
logo of bytedance
社招3年以上A43408

1、负责设计、开发数据平台与后端服务的架构,确保系统在高并发、大数据场景下具备良好的可用性、高性能及扩展性,满足业务增长需求; 2、设计数据库规划存储方案,实现高效存储与快速检索,搭建后端服务,实现业务逻辑; 3、遵循微服务架构,拆分业务为独立模块,优化系统;协同前端团队,定义、维护API接口,保障数据交互流畅,提升用户体验。

更新于 2025-06-23
logo of netease
社招5年以上网易职能

1. 加入效率工程部,负责网易数据平台应用的研发和迭代; 2. 重点关注系统并发性能、可靠性等方面,解决系统开发技术难点,参与架构持续升级; 3. 关注互联网热点技术的发展方向,能够提出、评估并应用新技术; 4. 参与新系统需求分析与讨论,并提出技术可行性方案;

更新于 2025-06-20
logo of youzan
社招

1. 负责统一数据服务平台(OneService)的架构设计、研发与持续优化,构建公司级标准、高效、智能的数据消费入口,支持自然语言查询、报告生成等多种数据访问方式; 2. 规划并建设指标管理体系,包括指标定义、血缘、版本、生命周期等模块,打造规范化、工具化的指标生产与管理流程,保障口径一致与结果准确; 3. 持续提升平台的数据服务能力,支持 BI 报表、自助分析、API 调用、运营活动等多样化消费场景,推动数据在经营分析、运营决策中的智能化落地; 4. 探索并集成大语言模型(LLM)与语义建模能力,提升用户通过自然语言与数据交互的体验与效率,降低数据使用门槛; 5. 参与知识库系统打通的能力建设,将结构化数据能力与非结构化知识服务融合,打造商家经营相关的“数+知”一体化智能服务; 6. 优化数据平台整体架构,提升系统稳定性与查询性能,降低接入与维护成本,持续迭代用户体验; 7. 与数据分析师、产品经理、业务团队紧密协作,抽象共性需求,构建平台级的数据产品能力,推动数据资产高效复用。

更新于 2025-07-21