字节跳动数据仓库开发工程师-头条西瓜方向
社招全职JDS8P地点:北京状态:招聘
任职要求
1、 仓库实施方法论、深入了解数据仓库体系,并支撑过实际业务场景; 2、 熟练使用Hadoop及Hive,熟悉SQL、Java、Python等编程语言; 3、 善于沟通,对业务敏感,能快速理解业务背景,具备优秀的技术与业务结合能力。
工作职责
1、 负责头条和西瓜视频的离线与实时数据仓库的构建; 2、 负责数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决; 3、 负责指标体系建设与维护; 4、 深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、 参与大数据应用规划,为数据产品、业务团队提供应用指导; 6、 参与数据治理工作,提升数据易用性及数据质量。
包括英文材料
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
相关职位
社招JVVJP
1、负责字节跳动旗下幸福里/今日头条/游戏业务/西瓜视频/搜索业务/小说/审核/搜索等一个或多个业务线的数据仓库架构设计、建模和ETL开发; 2、参与数据治理工作,提升数据易用性及数据质量,与数据工具团队紧密合作; 3、理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作。
更新于 2021-04-12
社招JTY31
1、负责今日头条的用户产品线的数据仓库架构设计、建模和ETL开发; 2、参与数据治理工作,提升数据易用性及数据质量,与数据工具团队紧密合作; 3、理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作。
更新于 2019-01-10
社招1年以上JMAHP
1、负责内容业务数据体系的规划设计和建设,通过数据产品和数据服务等方式,实现数据驱动业务增长; 2、负责内容业务的离线数仓、实时数仓、数据服务化的设计、开发、性能优化,为上层分析和挖掘提供可靠、统一的离线+实时数据服务; 3、负责内容数据分析平台建设,面向产品、运营、分析师等提供体验良好的万亿规模的交互式/可视化分析工作台; 4、负责离线/实时的ETL工作,为业务提供定制化的数据支持,并优化计算任务性能; 5、负责沉淀内容数据化运营平台,打造内容域的策略型增长平台,驱动业务高速增长。
更新于 2021-03-05