携程资深数据仓库工程师(MJ025987)
社招全职5年以上旅游业务AI & BI地点:上海状态:招聘
任职要求
计算机科学、软件工程、信息管理或相关专业本科及以上学历。 5年以上数据仓库相关项目经验,熟悉数据仓库建设流程,对数据治理、数据资产运营都体系化落地经验 精通 SQL 语言,熟悉大数据体系,包括但不限于Spark、Hive、Flink、Paimon等。 熟悉并了解主流的数仓理论,包括Kimball建模、指标体系理论 具备良好的沟通能力,能够清晰地向非技术人员解释数据领域概念。 具备良好的团队合作精神,能够与不同部门紧密合作。
工作职责
参与离线和实时数据仓库架构设计和开发,构建高效、稳定、可扩展的数据仓库系统。 负责数据仓库模型设计,包括星型模型、雪花模型、星座模型等,并制定数据仓库开发规范。 负责数据资产的运营,结合业务现状,解决数据资产生产、消费过程中的卡点,提升相关团队的用数体验 开发和维护 ETL/ELT 数据 pipeline,确保数据高效、准确地从源系统加载到数据仓库 优化数据仓库性能,解决数据查询和数据加载的性能瓶颈。
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
数据治理+
https://www.ibm.com/think/topics/data-governance
Data governance is the data management discipline that focuses on the quality, security and availability of an organization’s data.
https://www.youtube.com/watch?v=uPsUjKLHLAg
Building data fabric eliminates the technological complexities of data governance so users can connect to the right data at the right time, regardless of where it resides.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
相关职位
社招旅游业务AI &
1、负责数据仓库模型迭代以及数据仓库应用产品的设计和开发; 2、负责各项常规数据需求/看板的搭建和维护,建立例行的数据监控机制; 3、负责对业务关键数据进行统计分析,提出具有建设性的建议及分析报告; 4、参与专题分析,对业务模型抽象、数据模型设计开发,通过深层次的数据挖掘发现问题,驱动业务。
更新于 2025-04-02
社招3年以上JERU2
1、以抖音系全域数据为依托,参与构建海量数据下符合生活服务业务特性的数据仓库建设; 2、负责数据模型的架构设计、开发以及海量数据下的性能调优、复杂业务场景下的需求交付; 3、参与构建围绕安全、质量、效率、成本等方向的数据管理能力建设,并推动某细分横向场景的落地; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作。
更新于 2021-11-18
社招3年以上A61080
1、对业务问题进行合理抽象和设计,设计和开发高质量的底层数据体系,驱动业务快速健康发展; 2、负责数据模型的架构设计、开发以及海量数据下的性能调优、复杂业务场景下的需求交付; 3、参与构建围绕数据安全、质量、效率、成本等方向的数据管理能力建设,在横向场景落地; 4、深入业务,理解并合理抽象业务需求,发挥数据价值,与业务团队紧密合作; 5、参与数据平台架构设计,核心模块任务开发工作。
更新于 2024-06-26