快手数据研发工程师(数据资产)-【数据平台】
社招全职1年以上D6225地点:北京状态:招聘
任职要求
1、一年以上数据研发经验; 2、掌握大数据计算技术体系,了解熟悉Hadoop/Hive/Spark/Fink/Storm等大数据框架; 3、精通数据仓库建模和离线/实时ETL开发技术,优秀的SQL查…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、整合快手全域海量异构数据,建设公司级核心资产,包括但不限于统一ID服务、时空资产和用户画像; 2、参与核心资产研发体系建设,比如架构设计、数仓建设和数据治理; 3、技术攻坚,解决海量数据下的复杂技术问题,比如关系挖掘、图挖掘中的工程问题; 4、深入业务场景,了解业务痛点,为各业务线提供数据驱动的解决方案。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
还有更多 •••
相关职位
社招D11761
1、建设全站的基础数据能力,提供丰富、稳定的短视频社区公共基础数据,探索更多数据能力的增量价值; 2、通过业务数据需求,提供数据采集埋点方案,跟进埋点全流程,交付结果,推进埋点质量相关建设; 3、支持消费、本地生活等业务的数据建设,通过数据+算法+产品,赋能业务,提供全链路、可分析、可复用的数据能力,提供更直观、更具分析指导性的产品化能力; 4、建设公司层面的核心数据资产,与业务场景深度结合,为社区服务提供数据服务化、数据业务化的数据&产品解决方案; 5、建设全站数据治理和管理体系,结合业务+元数据+技术,保障公司各个业务服务的数据质量和产出稳定。
更新于 2025-03-07北京
社招3年以上
1、负责淘系各类决策数据体系的建设,通过数据+工程化,联合BI赋能管理决策,提供高质、稳定的决策数据产品; 2、构建淘系模型、稳定性、质量、成本等治理体系,建设丰富的技术+业务元数据,通过工程化能力,打造先进的淘宝数据治理平台,服务前台业务; 3、打造面向AI时代的数据资产平台; 4、基于新数据资产平台,构建AI研发、AI取数、AI分析等应用场景落地。
更新于 2025-12-26杭州
社招3年以上技术类-数据
1、建设淘海外标准化数据体系,沉淀高质量数据资产,助力业务高效运转; 2、建设归因分析能力与AB测试数据能力,打造业务的核心决策数据产品,助力业务高效决策; 3、协同产技,通过数据+算法+工程化能力,提供数据洞察与产品化解决方案,提升业务数据化运营能力。
更新于 2025-08-25杭州