字节跳动大数据工程师-数仓方向
社招全职T0951地点:北京状态:招聘
任职要求
1、熟悉数据仓库实施方法论、深入了解数据仓库体系,并支撑过实际业务场景; 2、熟练使用Hadoop及Hive,熟悉S…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、 负责电商、生活服务、直播、抖音等业务的离线与实时数据仓库的构建; 2、负责数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 3、负责指标体系建设与维护; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、参与大数据应用规划,为数据产品、挖掘团队提供应用指导; 6、参与数据治理工作,提升数据易用性及数据质量。
包括英文材料
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招K9374
1、负责电商、生活服务、直播、抖音等业务的离线与实时数据仓库的构建; 2、负责数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 3、负责指标体系建设与维护; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、参与大数据应用规划,为数据产品、挖掘团队提供应用指导; 6、参与数据治理工作,提升数据易用性及数据质量。
更新于 2023-02-06上海
校招程序技术类
1.负责数据收集、清洗、转换和处理(ETL)流程的设计,开发和实施。 2.参与数据体系的技术调研、验证。 3.监控数据质量,确保数据的准确性和完整性。 4.参与数据仓库的建设、模型的梳理和建立。
上海
社招自动驾驶板块
1. 数据指标体系搭建:深挖数据价值,构建和维护车端信号数据仓库体系和数据指标体系,为算法和数据闭环提供PB级共享平台和框架支持;负责核心数据指标体系(包括业务分类、生产状态、功能指标等)的搭建、监控与运营;快速输出并不断沉淀标准化的产品数据体系,让业务的数据化运营更加高效、便捷; 2. 数据治理:梳理上下游的数据资产,制定及推广数据标准(如研发规范、质量规范、保障规范)和治理流程,确保数据准 确性、完整性和一致性。 3. 数据管理:负责元数据管理、数据质量检查、数据分级管理等系统的设计、开发及应用,提升数据易用性、可用性及稳定性; 4. 业务团队数据需求的研发支撑:如日志埋点、车联网数据、内部与外部数据的采集、数据同步、数据清洗与标准化、数据模型设计、离线数据处理、实时数据处理、数据服务化、数据可视化等;
更新于 2025-07-08广州