小红书数据引擎开发实习生
任职要求
1. 26年毕业同学,计算机相关专业,基础扎实,对新技术有强烈的学习热情
2. 有大数据相关框架/工具经验者优先,e.g.…工作职责
【业务介绍】 数据引擎是大数据Infra团队,提供大数据存储、计算、平台基础能力,支持EB级别数据的实时集成、开发加工、消费使用的全链路数据解决方案。 【职位描述】 1. 负责大数据计算引擎以及数据平台的研发工作,支撑公司内社区、电商以及商业化业务; 2. 面向PB级海量数据的解决方案设计,处理每日千亿级增量的用户行为数据; 3. 通过提供优秀的引擎和平台产品,配合数据产品及数据仓库团队,建设高效的数据研发体系,提供高效稳定的数据服务,降低数据的使用门槛,实现数据的最大价值。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:数据平台是字节跳动数据中台部门,横向支持公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也在致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、打造业界PB级OLAP引擎,支撑字节跳动主要产品线(如抖音、今日头条)的ETL、湖仓分析场景等; 2、参与以Spark、Doris、Presto等为代表的大数据引擎内核优化; 3、打造基于高并发大流量业务场景的大数据查询服务、任务调度系统、异构数据湖统一元数据服务及权限管理服务的设计和研发; 4、参与字节跳动数据引擎的架构设计、业务场景支持、性能优化与降本、稳定性提升。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:负责字节跳动一站式数据研发治理套件Dataleap,提供从数据集成、开发、治理、资产管理、安全合规等全链路大数据管理能力,帮助数据团队有效降低工作成本和数据维护成本、挖掘数据价值,为企业决策提供数据支撑。 1、参与全域数据集成平台和底层引擎的开发迭代和优化; 2、参与需求调研与用户技术支持; 3、追求极致,构建业内领先的数据中台产品。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动Data-数据平台,为公司各业务线发展提供一站式大数据解决方案。其中涉及到可以支持EB级数据大规模写入和查询分析的引擎系统开发,对开源的 ClickHouse / SparkSQL / Presto / Hive / Hudi 等大数据引擎,进行源码级别的深度优化和改造,提供更强的性能、更便捷的操作,目前已覆盖字节内部大部分业务的数据分析场景。同时我们的这部分能力,还通过火山引擎对外输出:基于 ClickHouse 打造的云原生数据分析平台/企业实时数据仓库 ByteHouse ;基于湖仓一体和批流一体技术打造的企业级智能实时湖仓 LAS 。 1、负责字节跳动大数据平台的产品前端开发; 2、拥抱前沿技术,尝试最新前端技术。