
水滴数据仓库工程师
社招全职3年以上大数据地点:北京状态:招聘
任职要求
1.本科以上学历,计算机或相关专业,3年以上数仓经验; 2.深入理解常用的数据建模理论,可独立把控数据仓库各层级的设计; 3.熟悉开源大数据平台生态圈,包括但不限于spark、presto、druid、flink、hive、hadoop、kafka等; 4.熟悉Linux平台,熟悉SQL/Python/J…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责保险业务数据仓库建设,优化及解决相关技术问题; 2.负责数据内容产品落地,实现数据价值产品化; 3.负责所在方向数据治理工作,保证数据稳定产出
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Presto+
[英文] What is Presto?
https://prestodb.io/what-is-presto/
https://www.tutorialspoint.com/apache_presto/index.htm
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
还有更多 •••
相关职位
社招旅游业务AI &
1、负责数据仓库模型迭代以及数据仓库应用产品的设计和开发; 2、负责各项常规数据需求/看板的搭建和维护,建立例行的数据监控机制; 3、负责对业务关键数据进行统计分析,提出具有建设性的建议及分析报告; 4、参与专题分析,对业务模型抽象、数据模型设计开发,通过深层次的数据挖掘发现问题,驱动业务。
更新于 2025-04-02上海
社招住宿业务AI &
1、负责离线和在线数据的采集、清洗和加载; 2、负责通过专项分析,输出专项分析报告,为业务决策和监控提供数据支持; 3、负责携程大量商户/用户数据的分析和提炼。
更新于 2025-03-31上海
社招3年以上IDG
-深度参与自动驾驶数据流水线开发,构建高可用、易扩展、低延迟的系统服务架构 -参与自动驾驶模型迭代相关的数据仓库、数据处理及车云互联服务开发工作 -设计、开发用户端SDK、API支持自动驾驶数据高效、稳定、高并发低时延地读写 -设计及实现合理的数据生命周期管理策略,保证满足业务数据需求的存储成本控制
更新于 2025-04-10北京