快手数仓高级架构师-【数据平台部】
社招全职5年以上D0599地点:北京状态:招聘
任职要求
1、计算机相关专业本科以上学历,五年以上互联网数据仓库、数据开发工作经验; 2、精通数据仓库架构及原理,具备大型数据仓库架构设计、模型设计和处理性能调优等相关经验; 3、具备丰富的数仓治理优化经验,具备大型项目管理能力; 4、对离线SQL、hive、spark及性能调优或实时计算开发和调优至少一方面…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、结合业务用数场景,对快手数仓架构深度分析,给出架构优化方案并负责牵头落地; 2、快速理解数据现状和业务场景,从数仓架构、数据易用性、资源成本、时效等视角出发给出数仓治理优化方案,并负责核心开发落地; 3、基于HUDI等技术,结合数仓现状,联动数据引擎团队推进数据湖的应用落地。
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
性能调优+
https://goperf.dev/
The Go App Optimization Guide is a series of in-depth, technical articles for developers who want to get more performance out of their Go code without relying on guesswork or cargo cult patterns.
https://web.dev/learn/performance
This course is designed for those new to web performance, a vital aspect of the user experience.
https://www.ibm.com/think/insights/application-performance-optimization
Application performance is not just a simple concern for most organizations; it’s a critical factor in their business’s success.
https://www.oreilly.com/library/view/optimizing-java/9781492039259/
Performance tuning is an experimental science, but that doesn’t mean engineers should resort to guesswork and folklore to get the job done.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招2年以上
阿里资产技术团队负责建设全球领先的网络资产处置平台,承载司法拍卖、破产处置、珍品交易等多个市场体量巨大的业务,挑战海量用户和数据、巨量资金带来的复杂大型互联网系统架构。 1. 负责阿里资产数据体系的规划设计和建设,通过数据产品和数据服务等方式,实现数据驱动业务增长; 2. 负责阿里资产相关的离线数仓、实时数仓,数据服务化的设计、开发、性能优化,为上层分析和挖掘提供可靠、统一的离线+实时数据服务; 3. 负责离线/实时的ETL工作,为各业务提供定制化的数据支持,并优化计算任务性能; 4. 沉淀分析思路与框架,提炼数据产品需求,与算法、工程团队合作,实现数据精细化运营。
更新于 2025-06-06杭州
社招XKJL
1、参与公司火山引擎全域数据集成平台的开发和建设; 2、深入理解业务场景,与业务部门深度合作,设计架构并落地产品; 3、探索实时传输和批流一体等研发能力,提升用户的数据集成体验,打造业界领先的集成平台。
更新于 2022-04-14深圳
社招2年以上技术类-前端
● 参与和负责蚂蚁图计算相关的产品前端研发,为蚂蚁一线业务提供稳定好用的图研发和分析产品; ● 参与蚂蚁智能化商业洞察产品的建设,通过数据可视化等前端技术助力用户从数据到洞见; ● 参与蚂蚁用户行为分析产品建设,从规范到 SDK 到分析全链路闭环建设; ● 参与蚂蚁数据研发平台产品建设,了解业内复杂数据体系下数仓建设,并通过 AI 改变数据探查与研发模式; ● 参与产品体验度量产品建设,从 0-1 定义蚂蚁自己的产品度量体系,帮助产品提升体验; ● 探索未来,结合业务产品 和 AI 的新创意
更新于 2025-08-26北京