阿里巴巴淘天算法技术-高级大数据研发工程师(数仓)-杭州
社招全职地点:杭州状态:招聘
任职要求
1. 有从事分布式数据存储与计算机应用开发经验,熟悉大数据生态相关技术并有开发经验,有Spark/Flink开发经验优先; 2. 有较为丰富的数据仓库及数据平台的架构经验,…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 参与围绕泛搜推领域数据的数据工程研发体系建设,通过数据+算法分析+工程化能力,高效赋能业务; 2. 通过抽象业务域,简历规范化的数据解决方案,通过构建实时、离线数仓为业务提供稳定、安全的数据源; 3. 参与湖仓一体的下一代大数据解决方案建设,提升效率,更好的支持业务; 4. 参与到实验效果的分析中,提供更科学的实验指导及实验分析。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招3年以上
1、参与淘天物流数据体系建设,通过实时和离线大数据模型体系的构建和开发,提供统一、可靠的数据服务和产品化能力; 2、参与淘天物流数据架构、技术体系、数据模型的规划建设,包括数据采集、数据治理、数据质量及稳定性保障体系、数据处理智能化和自动化体系的建设; 3、能够针对业务场景探索提供大数据解决方案,并实现数据产品化。
更新于 2025-12-10杭州

社招3年以上
1. 负责内容种草据体系的规划设计和建设,通过数据产品和数据服务等方式,实现数据驱动业务增长; 2. 负责内容种草场景相关的离线数仓、实时数仓,数据服务化的设计、开发、性能优化,为上层分析和挖掘提供可靠、统一的离线+实时数据服务; 3. 负责离线/实时的ETL工作,为各业务提供定制化的数据支持,解决大规模数据场景下的计算效率、资源调度及容错问题; 4. 沉淀分析思路与框架,提炼数据产品需求,与业务、产品、算法、工程团队合作,设计高扩展性数据解决方案,实现数据精细化运营推动数据价值转化为业务增长;
更新于 2026-03-30北京|杭州
社招1-3年网易云音乐
1、负责音乐离线数据仓库的研发,通过设计合理的数据架构确保内外部数据的准确性、一致性和稳定性,工作内容包括但不限于数据清洗、模型设计、数据治理及系统稳定性保障。 2、深入理解业务需求,通过洞察业务策略来整合和收敛数据需求,提供系统化的解决方案并推动实施。 3、与数据分析师紧密合作,促进数据在产品运营中的应用,利用技术创新使数据成为业务发展的核心驱动力。 4、具备一定工程开发能力,负责AI agent相关应用的开发,探索数据与AI结合的创新场景,推动数据处理流程的自动化和智能化升级。
更新于 2025-06-20杭州