小红书数据仓库高级专家(离线方向)
社招全职5年以上数据仓库地点:上海状态:招聘
任职要求
本科及以上学历,5年以内的数据仓库相关研发经验,对数据和业务敏感,具备良好的数据模型设计能力 熟悉数据仓库各类模型建模理论,了解数据仓库数据流和架构 精通大数据技术,如Hive,Spark,Flink等,并具备数据开发及调优经验 良好的沟通能力和项目管理技能,能够在项目实施过程中确保数据仓库建设以及数据解决方案落地的进度和质量 具备一定的行业知识(电商行业),能够将行业知识与数据仓库的开发和维护相结合,实现数据的价值最大化
工作职责
快速响应业务数据需求,提供数据解决方案 负责离线数据仓库某个主题域的设计、建设和优化,确保数据的准确性和完整性 根据业务需求,设计和实现数据模型,包括星型模型和雪花模型等,适应业务的快速迭代 负责ETL流程的开发和维护,确保业务需求实现的效率和交付质量 参与数据仓库的系统优化和计算性能提升
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
相关职位

社招5年以上技术
1、能够负责金融信贷业务板块实时数据仓库与离线数据仓库的需求管理、架构设计、模型建设和数据研发工作,保证数据服务的稳定性和准确性; 2、能够对数据仓库团队初/中级人员在数据仓库建模、数据治理、金融业务等方向进行培养; 3、能够通过数据资产治理、数据需求交付时效提升等方式实现数据仓库工作的降本提效。 4、能够与上下游紧密协作,为金融商信贷业分析、业务决策、业务运营、数据产品等提供有效数据支撑,对信贷业务赋能; 5、能够与行业先进的数据技术对标,采用最佳技术实践解决业务数据需求痛点。
更新于 2025-02-05
社招J5LM1
1、面向字节跳动旗下相关产品线,为业务指标建设提供支持和指导; 2、建设PB级数据仓库,参与负责数据仓库设计、建模、研发等; 3、建设ETL数据管道及自动化的ETL数据管道系统; 4、建设离线、在线、实时相结合的指标数据处理专家系统。
更新于 2019-07-28
社招5年以上技术类-数据
1. 负责高德业务的离线与实时数据仓库的构建和数据架构设计,包括数据模型的设计,ETL实施,ETL性能优化,ETL数据监控以及相关技术问题的解决,指标体系建设与维护等; 2. 提高高德数仓团队架构能力和数据治理能力,不断提升需求支持效率、数据开发效率、提升数据质量、降低数据使用成本; 3. 支撑高德业务数据和运营需求,不断提升用数的能力和数据分析能力,深入业务,理解并合理抽象业务需求,发挥数据价值,提高运营运转效率,建设数字化运营能力。
更新于 2025-04-17