OPPO高级数据开发工程师
社招全职5-10年SOFTWARE地点:深圳状态:招聘
任职要求
1、本科及以上学历,计算机相关专业毕业,从事互联网数据开发领域工作5年以上; 2、熟悉一个或多个Hadoop、Spark、Flink、Kafka、Hive、Clickhouse等主流大数据系统; 3、有超PB级别大数据处理实战经验,熟悉大数据完整处理流程,具备大数据任务异常诊断与性能优化能力; 4、掌握维度建…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责互联网业务离线和实时数仓设计与开发、数据治理及相关数据资产管控; 2、深入理解业务逻辑,支撑业务数据埋点设计、搭建完善的数据体系,为业务运营提供完善的线上实时数据服务,充分赋能业务; 3、负责大数据领域实时和离线相关技术的研究和沉淀,保障大数据平台日常运维,并推动相关技术在业务的应用
包括英文材料
学历+
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
Kafka+
https://developer.confluent.io/what-is-apache-kafka/
https://www.youtube.com/watch?v=CU44hKLMg7k
https://www.youtube.com/watch?v=j4bqyAMMb7o&list=PLa7VYi0yPIH0KbnJQcMv5N9iW8HkZHztH
In this Apache Kafka fundamentals course, we introduce you to the basic Apache Kafka elements and APIs, as well as the broader Kafka ecosystem.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招1-3年网易有道
1. 参与升学中心数据仓库设计与研发,完成数据建模的设计和开发以及数据监控,性能优化等相关技术工作 2. 结合升学中心业务特点,进行指标/标签体系的搭建 3. 参与数仓研发质量保障体系的完善和实施,打造稳定可靠的数据服务和保障体系 4. 调研和跟进大数据技术发展趋势进行相关数据方案的探索落地 5. 编写和维护数仓文档
更新于 2025-04-03北京
社招技术类
1、负责公司内视频云业务数据的开发和维护,为点直播业务与视频云研发团队提供快速、准确、灵活的数据仓库支持; 2、深入理解业务逻辑,完成数据模型设计及优化工作; 3、完成海量数据的获取、清洗、分类、整合等数据处理工作; 4、设计并实现对BI分析及报表展现、数据产品开发; 5、独立完成数据问题的排查与处理,解决数据质量与性能问题;
更新于 2025-02-13上海
社招3-5年网易游戏(互娱)
1、负责建设中台数据仓库架构,包括元数据管理、ETL调度、数据集成、OLAP等子系统的设计和开发; 2、制定和推广数据字典,建立完善的元数据管理规范,负责数据质量监控和数据资产管理; 3、搭建和维护中台数据仓库表,解决业务人员在仓库系统流程、工具使用、数据处理等建到的问题; 4、深入了解网易游戏、藏宝阁、网易大神等业务,负责数据仓库和其它业务系统接口; 5、基于对数据的理解和业务需求,对数据进行整理、分析和用户画像搭建。
更新于 2025-08-04广州