字节跳动数据仓库开发工程师——飞书业务应用
社招全职3年以上A221722地点:成都状态:招聘
任职要求
1、计算机、数学相关专业本科及以上学历,三年及以上大数据开发实际工作经验; 2、深入理解常用的维度建模理论,可独立把控数据仓库的各层级设计,有OLAP分析应用经验;有数据挖掘,数据分析相关经验优先; 3、熟练掌握HSQL,熟悉Spark/Hive/Flink分布式计算框架,熟悉大数据的离线和实时处理,可以进行海量数据模型的设计、开发; 4、有产品思维,主动思考基于业务场景下的数据体系建设; 5、工作认真负责,有良好的团队合作精神和解决问题分析能力,钻研技术克服困难,勇于挑战。
工作职责
1、负责飞书People产品线核心业务离线&实时数据仓库构建; 2、负责维度模型的设计和大数据开发,解决数据任务性能优化、质量提升等技术问题; 3、负责打通不同业务线数据内容,形成统一数据模型; 4、负责全产品线数据治理,提升数据资产质量。
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
OLAP+
https://www.youtube.com/watch?v=iw-5kFzIdgY
OLAP (for online analytical processing) is software for performing multidimensional analysis at high speeds on large volumes of data from a data warehouse, data mart, or some other unified, centralized data store.
数据挖掘+
https://www.youtube.com/watch?v=-bSkREem8dM
Database vs Data Warehouse vs Data Lake
https://www.youtube.com/watch?v=7rs0i-9nOjo
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
相关职位
社招3年以上A124396
1、负责飞书People产品线业务离线&实时数据仓库构建; 2、负责维度模型的设计和大数据开发,解决数据任务性能优化、质量提升等技术问题; 3、负责打通不同业务线数据内容,形成统一数据模型; 4、负责全产品线数据治理,提升数据资产质量。
更新于 2023-12-19
社招3年以上
1、负责飞猪核算平台的设计与建设; 2、负责飞猪系统、财务系统中涉及结算模块的数据标准化和数据质量建设; 3、根据业务场景的需求设计合理的结算流程、结算规则、结算表单,进行数据挖掘分析; 4、通过数据分析,对业务运行情况进行监控和预测,并提出合理化的改进建议。 5、参与飞猪内部结算平台对接工作,进行系统对接方案设计、系统接口开发及测试验证。
更新于 2025-06-30
社招5年以上旅游业务AI &
1. 赋能客服服务部门,参与客服系统的离线和实时数据仓库架构设计和开发,构建高效、稳定、可扩展的数据仓库系统。 2. 负责数据建设体系规划、模型设计、建设与运营,解决数据生产、消费过程中的卡点。 3. 沉淀并维护模型指标,提升指标复用性与分析效率,完善客服板块数据建设方法论,提升相关团队的用数体验。 4. 优化数据仓库性能,解决数据查询和数据加载的性能瓶颈,对现有数据模型及架构进行升级改造。 5. 推动数据产品化和服务化,设计体系化数据产品方案,与相关团队协作并推动产品落地。
更新于 2025-05-26