哔哩哔哩高级数据开发工程师
社招全职技术类地点:上海状态:招聘
任职要求
1、本科及以上学历,计算机、数学、统计等相关专业背景; 2、有数据建模基础,并能根据需求独立完成建模;熟悉数据仓库架构,了解数据仓库建模方法与技巧; 3、对数据有较强的敏感性,有较强数据分析能力,通过数据之间关系反推业务逻辑; 4、有基于hadoop和spa…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责公司内视频云业务数据的开发和维护,为点直播业务与视频云研发团队提供快速、准确、灵活的数据仓库支持; 2、深入理解业务逻辑,完成数据模型设计及优化工作; 3、完成海量数据的获取、清洗、分类、整合等数据处理工作; 4、设计并实现对BI分析及报表展现、数据产品开发; 5、独立完成数据问题的排查与处理,解决数据质量与性能问题;
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
还有更多 •••
相关职位
社招1-3年网易有道
1. 参与升学中心数据仓库设计与研发,完成数据建模的设计和开发以及数据监控,性能优化等相关技术工作 2. 结合升学中心业务特点,进行指标/标签体系的搭建 3. 参与数仓研发质量保障体系的完善和实施,打造稳定可靠的数据服务和保障体系 4. 调研和跟进大数据技术发展趋势进行相关数据方案的探索落地 5. 编写和维护数仓文档
更新于 2025-04-03北京
社招3-5年网易游戏(互娱)
1、负责建设中台数据仓库架构,包括元数据管理、ETL调度、数据集成、OLAP等子系统的设计和开发; 2、制定和推广数据字典,建立完善的元数据管理规范,负责数据质量监控和数据资产管理; 3、搭建和维护中台数据仓库表,解决业务人员在仓库系统流程、工具使用、数据处理等建到的问题; 4、深入了解网易游戏、藏宝阁、网易大神等业务,负责数据仓库和其它业务系统接口; 5、基于对数据的理解和业务需求,对数据进行整理、分析和用户画像搭建。
更新于 2025-08-04广州
社招5年以上软硬件服务-充电
1、基于美团的数据平台进行离线和实时数据仓库建设,数据分析以及预测。 2、梳理业务系统数据,进行数据模型设计和开发,产出支持业务分析的基础数据,保障数据的准确性、易用性、及时性。 3、负责业务的数据需求、数据报表、OLAP开发以及临时数据提取的开发任务 4、参与技术决策和技术选型,制定流程规范,完善数据质量监控和数据治理。 5、针对海量IoT数据进行数据处理和模型训练,提升健康运维的效率。
更新于 2025-06-20北京