哔哩哔哩高级数据开发工程师
社招全职技术类地点:上海状态:招聘
任职要求
1、本科及以上学历,计算机、数学、统计等相关专业背景; 2、有数据建模基础,并能根据需求独立完成建模;熟悉数据仓库架构,了解数据仓库建模方法与技巧; 3、对数据有较强的敏感性,有较强数据分析能力,通过数据之间关系反推业务逻辑; 4、有基于hadoop和spark分布式平台的数仓经验,熟悉Hadoop、Hive、Spark、Kafka等技术并有相关开发经验; 5、熟悉Shell,Python,Perl至少一种脚本语言; 6、有公有云、视频云业务相关经验者优先; 7、有独立自主完成完整业务线数仓的整合搭建的经验优先。
工作职责
1、负责公司内视频云业务数据的开发和维护,为点直播业务与视频云研发团队提供快速、准确、灵活的数据仓库支持; 2、深入理解业务逻辑,完成数据模型设计及优化工作; 3、完成海量数据的获取、清洗、分类、整合等数据处理工作; 4、设计并实现对BI分析及报表展现、数据产品开发; 5、独立完成数据问题的排查与处理,解决数据质量与性能问题;
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Kafka+
https://developer.confluent.io/what-is-apache-kafka/
https://www.youtube.com/watch?v=CU44hKLMg7k
https://www.youtube.com/watch?v=j4bqyAMMb7o&list=PLa7VYi0yPIH0KbnJQcMv5N9iW8HkZHztH
In this Apache Kafka fundamentals course, we introduce you to the basic Apache Kafka elements and APIs, as well as the broader Kafka ecosystem.
Bash+
[英文] The Bash Guide
https://guide.bash.academy/
A quality-driven guide through the shell's many features.
https://www.youtube.com/watch?v=tK9Oc6AEnR4
Understanding how to use bash scripting will enhance your productivity by automating tasks, streamlining processes, and making your workflow more efficient.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Perl+
https://www.perl.org/learn.html
Useful links if you are interested in learning Perl
https://www.runoob.com/perl/perl-tutorial.html
本教程适合想从零开始学习 Perl 编程语言的开发人员。当然本教程也会对一些模块进行深入,让你更好的了解 Perl 的应用。
脚本+
[英文] Scripting language
https://en.wikipedia.org/wiki/Scripting_language
https://zhuanlan.zhihu.com/p/571097954
一个脚本通常是解释执行而非编译。脚本语言通常都有简单、易学、易用的特性,目的就是希望能让程序员快速完成程序的编写工作。
相关职位
社招1-3年网易有道
1. 参与升学中心数据仓库设计与研发,完成数据建模的设计和开发以及数据监控,性能优化等相关技术工作 2. 结合升学中心业务特点,进行指标/标签体系的搭建 3. 参与数仓研发质量保障体系的完善和实施,打造稳定可靠的数据服务和保障体系 4. 调研和跟进大数据技术发展趋势进行相关数据方案的探索落地 5. 编写和维护数仓文档
更新于 2025-04-03
社招3-5年网易游戏(互娱)
1、负责建设中台数据仓库架构,包括元数据管理、ETL调度、数据集成、OLAP等子系统的设计和开发; 2、制定和推广数据字典,建立完善的元数据管理规范,负责数据质量监控和数据资产管理; 3、搭建和维护中台数据仓库表,解决业务人员在仓库系统流程、工具使用、数据处理等建到的问题; 4、深入了解网易游戏、藏宝阁、网易大神等业务,负责数据仓库和其它业务系统接口; 5、基于对数据的理解和业务需求,对数据进行整理、分析和用户画像搭建。
更新于 2025-08-04
社招5年以上软硬件服务-充电
1、基于美团的数据平台进行离线和实时数据仓库建设,数据分析以及预测。 2、梳理业务系统数据,进行数据模型设计和开发,产出支持业务分析的基础数据,保障数据的准确性、易用性、及时性。 3、负责业务的数据需求、数据报表、OLAP开发以及临时数据提取的开发任务 4、参与技术决策和技术选型,制定流程规范,完善数据质量监控和数据治理。 5、针对海量IoT数据进行数据处理和模型训练,提升健康运维的效率。
更新于 2025-06-20