字节跳动资深大数据研发工程师-数据BP
社招全职2年以上QUR1地点:北京状态:招聘
任职要求
1、本科以上学历,2年以上互联网业务数据仓库模型设计、开发经验; 2、熟练使用Hadoop及Hive、spark,熟悉HQL调优。具备一定的Java、Python等语言开发能力 3、具有Clickhouse、Druid、pre…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责字节商业化数据仓库&集市的建设与维护,包括但不限于数据建模、数据开发、数据质量等 2、负责字节商业化业务数据BP,包括需求对接,抽象需求沉淀数据建模,结合产品矩阵灵活的把控技术方案,高质量交付需求 3、参与商业化数据治理工作,提升数据稳定性、易用性及数据质量 4、参与商业化大数据平台规划、为商业数据平台整体提供内容建设侧的应建议指导
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
还有更多 •••
相关职位
社招2年以上A100055
1、负责字节跳动商业化实验的离线与实时数据仓库的建设与维护,包括但不限于数据建模、数据开发、数据质量等; 2、负责字节跳动商业化实验的业务数据BP,包括需求对接,抽象需求沉淀数据建模,结合产品矩阵灵活的把控技术方案,高质量交付需求; 3、参与商业化实验的数据治理工作,提升数据稳定性、易用性及数据质量。
更新于 2025-04-22北京
社招3年以上W9795
1、负责飞书企业SaaS通用基础服务的架构设计与研发,打造低代码、无代码的SaaS平台。为海内外租户及用户提供优质且灵活的信息服务和极致体验; 2、为各个SaaS提供基础技术服务,包括但不限于元数据/主数据框架、事务引擎、IAM、BPM调度及工作流、实时/批量数据同步、沙箱及多租户隔离、事件平台、企业安全审计等功能模块; 3、 参与产品需求的讨论和规划、功能定义等,帮助职能部门梳理业务思路,固化工作流,提高效率; 4、协助团队攻克各种SaaS云服务隔离、大数据计算、海量并发并发吞吐、高可用性等方面的技术难点攻坚; 5、参与制定团队研发流程规范,帮助团队落地并提升整体的研发质量。
更新于 2023-02-06北京
社招A207964
1、负责飞书企业SaaS通用基础服务的架构设计与研发,打造低代码、无代码的SaaS平台;为海内外租户及用户提供优质且灵活的信息服务和极致体验; 2、为各个SaaS提供基础技术服务,包括但不限于元数据/主数据框架、事务引擎、IAM、BPM调度及工作流、实时/批量数据同步、沙箱及多租户隔离、事件平台、企业安全审计等功能模块; 3、参与产品需求的讨论和规划、功能定义等,帮助职能部门梳理业务思路,固化工作流,提高效率; 4、协助团队攻克各种SaaS云服务隔离、大数据计算、海量并发并发吞吐、高可用性等方面的技术难点攻坚; 5、参与制定团队研发流程规范,帮助团队落地并提升整体的研发质量。
更新于 2024-07-10杭州