贝壳大数据开发工程师【2026届实习生】(J67063)
任职要求
1、2026届在校生,硕士及以上学历,毕业时间:2025年9月-2026年8月; 2、掌握Java/Scala/Python程序开发(至少一种),掌握Linux/Unix开发环境; 3、了解常用开源分…
工作职责
1、构建分布式大数据服务平台,参与和构建公司包括海量数据存储、离线/实时计算、实时查询、BI等系统; 2、搭建贝壳集团统一的数据仓库,参与海量数据的存储、查询和运营数据分析体系搭建; 3、负责日常需求开发,实现高效的数据运营,服务日益增长的业务和数据量。
1、构建分布式大数据服务平台,参与和构建公司包括海量数据存储、离线/实时计算、实时查询、BI等系统; 2、搭建贝壳集团统一的数据仓库,参与海量数据的存储、查询和运营数据分析体系搭建; 3、负责日常需求开发,实现高效的数据运营,服务日益增长的业务和数据量。
1、负责 B站 海量数据的 抽取、转换、加载,数据维护等工作; 2、与业务团队深度合作,应用数据开发、分析等技术,提供数据解决方案,挖掘数据价值,提升数据使用效率; 3、在分布式计算、存储平台基础上建立高效、稳定的数据链路,打造平台化工具和数据应用产品;
团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等; 2、参与以Spark、Doris、Presto、Ray、Lance等为代表的大数据引擎内核优化; 3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发; 4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、负责分布式数据库(云原生架构)设计实现,打造业界领先的数据库系统; 2、深入底层系统与引擎,解决大规模生产环境集群可用性和性能优化问题; 3、理解业务/云原生架构,从场景出发,从软硬一体设计出发,打造极致系统; 4、跟踪数据库前沿技术,挖掘/落地新技术的机会,包括新硬件,智能优化器,湖仓一体等; 5、探索和落地AI/LLM与数据库的融合方向,如多模态数据数据分析,AI驱动的数据库运维自动化,基于AI Agent的智能助手等。