携程资深数据仓库工程师(MJ027072)
社招全职旅游业务AI & BI地点:上海状态:招聘
任职要求
1、精通SQL,具备海量数据开发能力,至少熟悉一种主流数据库(比如Oracle/MySQL/Teradata/Greenplum等),有Hive使用经验优先考虑; 2、熟悉数据仓库理论和数据模型设计,有实际经验优先考虑; 3、至少熟悉Java/Python等一种开发语言; 4、了解hadoop/spark基本原理,有MR或Spark的开发经验优先考虑; 5、熟悉熟悉实时数仓,以及湖仓相关经验优先; 6、有较好的逻辑分析能力,要求思维缜密,注重细节,善于协同合作。
工作职责
1、负责数据仓库模型迭代以及数据仓库应用产品的设计和开发; 2、负责各项常规数据需求/看板的搭建和维护,建立例行的数据监控机制; 3、负责对业务关键数据进行统计分析,提出具有建设性的建议及分析报告; 4、参与专题分析,对业务模型抽象、数据模型设计开发,通过深层次的数据挖掘发现问题,驱动业务。
包括英文材料
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Oracle+
[英文] Oracle Tutorial
https://www.oracletutorial.com/
On this website, you can learn Oracle Database fast and easily.
https://www.youtube.com/watch?v=QHYuuXPdQNM&list=PL_c9BZzLwBRJ8f9-pSPbxSSG6lNgxQ4m9
MySQL+
https://juejin.cn/post/7190306988939542585
这是一篇 MySQL 通关一篇过硬核经验学习路线,包括数据库相关知识,SQL语句的使用,数据库约束,设计等。
[英文] MySQL Tutorial
https://www.mysqltutorial.org/
your go-to resource for mastering MySQL in a fast, easy, and enjoyable way.
https://www.youtube.com/watch?v=5OdVJbNCSso
MySQL SQL tutorial for beginners
https://www.youtube.com/watch?v=7S_tz1z_5bA
This beginner-friendly course teaches you SQL from scratch.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
面向对象+
https://liaoxuefeng.com/books/java/oop/index.html
面向对象编程,英文是Object-Oriented Programming,简称OOP。
https://liaoxuefeng.com/books/python/oop/index.html
面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。
https://www.youtube.com/watch?v=SiBw7os-_zI
Learn the basics of object-oriented programming all in one video.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Teradata+
https://www.youtube.com/watch?v=2XtG8TKpV7w&list=PLMrTtbMO6mv_WKUILqw17BvvC_RAZLoeh
Greenplum+
https://www.youtube.com/watch?v=YKQmnkPNnUA&list=PL4duir3J-8GUodk1uS9ONPU_eWvfCeVjT
MapReduce+
https://www.youtube.com/watch?v=bcjSe0xCHbE
https://www.youtube.com/watch?v=cHGaQz0E7AU
In this video I explain the basics of Map Reduce model, an important concept for any software engineer to be aware of.
相关职位
社招5年以上旅游业务AI &
参与离线和实时数据仓库架构设计和开发,构建高效、稳定、可扩展的数据仓库系统。 负责数据仓库模型设计,包括星型模型、雪花模型、星座模型等,并制定数据仓库开发规范。 负责数据资产的运营,结合业务现状,解决数据资产生产、消费过程中的卡点,提升相关团队的用数体验 开发和维护 ETL/ELT 数据 pipeline,确保数据高效、准确地从源系统加载到数据仓库 优化数据仓库性能,解决数据查询和数据加载的性能瓶颈。
更新于 2025-02-26
社招3年以上JERU2
1、以抖音系全域数据为依托,参与构建海量数据下符合生活服务业务特性的数据仓库建设; 2、负责数据模型的架构设计、开发以及海量数据下的性能调优、复杂业务场景下的需求交付; 3、参与构建围绕安全、质量、效率、成本等方向的数据管理能力建设,并推动某细分横向场景的落地; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作。
更新于 2021-11-18
社招3年以上A61080
1、对业务问题进行合理抽象和设计,设计和开发高质量的底层数据体系,驱动业务快速健康发展; 2、负责数据模型的架构设计、开发以及海量数据下的性能调优、复杂业务场景下的需求交付; 3、参与构建围绕数据安全、质量、效率、成本等方向的数据管理能力建设,在横向场景落地; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、参与数据平台架构设计,核心模块任务开发工作。
更新于 2024-06-26