网易资深数仓开发工程师
社招全职3年以上网易云音乐地点:杭州状态:招聘
任职要求
1、计算机相关专业本科及以上学历,3年以上数据研发领域经验; 2、有较为丰富的数仓设计&开发经验,具备离线/实时数据处理能力,有海量数据离线处理经验优先考虑; 3、熟悉Hadoop/Spark/Flink生态相关技术,具备一定的JAVA、Scala语言的开发能力,能够结合多技术栈的优势提出业务解决方案; 4、良好的业务理解力,能从业务视角看问题,从技术角度解决业务问题; 5、良好的逻辑思维性,有良好的抗压能力和自驱能力,结果导向。
工作职责
1、负责音乐离线数据仓库的研发,通过合理的数据架构,保障内外数据的准确性、一致性和稳定性,包括数据清洗、模型设计、数据治理及稳定性保障; 2、深入理解业务,通过对业务策略的洞察,收敛业务数据需求,提供系统性的解决方案并落地; 3、与数据分析师合作推动数据为产品运营赋能,通过技术创新让数据为业务发展带来价值。
包括英文材料
学历+
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Scala+
相关职位
社招5年以上技术
1、能够独立负责金融某一业务板块实时数据仓库与离线数据仓库的需求管理、架构设计、模型建设和数据研发工作,保证数据服务的稳定性和准确性; 2、能够对数据仓库团队初/中级人员在数据仓库建模、数据治理、金融业务等方向进行培养; 3、能够通过数据资产治理、数据需求交付时效提升等方式实现数据仓库工作的降本提效。 4、能够与上下游紧密协作,为金融商业分析、业务决策、业务运营、数据产品等提供有效数据支撑,对业务赋能; 5、能够与行业先进的数据技术对标,采用最佳技术实践解决业务数据需求痛点。
更新于 2025-08-12
社招5年以上技术团队AI &
1.负责离线和实时数据仓库各层(如ODS、DWD、DWS、ADS)的模型设计、开发与优化,支撑数据分析和业务应用; 2.负责集团财务数据分析系统的数仓开发及报表开发; 3.独立完成复杂业务逻辑的数据ETL开发、任务调度与运维监控,保障数据加工流程的准确性和稳定性; 4.建立并监控数据质量规则,主动发现、跟踪并解决数据质量问题,确保数据的可靠性和可信度。
更新于 2025-09-08
社招2年以上信息技术类
大数据场景base深圳北京都OK 1.负责算法流量分配、前端页面迭代相关业务的数仓模型建设和设计;并根据需求变化和业务发展,持续优化模型; 2.结合公司相关配套数据产品,完成实际代码开发、部署,并对数据质量进行管理和优化; 3.构建自助分析数据资产,通过数据+产品,提供低成本的数据产品化能力;
更新于 2025-04-16