饿了么饿了么-数据研发专家-上海(优先)/杭州
社招全职3年以上技术类-数据地点:杭州 | 上海状态:招聘
任职要求
1. 计算机、数学、统计等相关专业本科及以上学历,3年以上互联网大数据研发相关工作经验,需有较强的逻辑思维能力和业务sense; 2. 熟悉数据仓库领域知识和技能者优先,包括但不局限于:数据集市设计、元数据管理、数据质量、主数据管理; 3. 熟悉大数据生态体系,包括不限于 Hive、HDFS、Spark、ClickHouse、Paimon数据湖 等等,具备实际项目开发经验; 4. 具备良好的数据分析和理解能力,能够将业务和数据连接,发掘机会,链接业务,解决问题; 5. base地:上海(优先)、杭州
工作职责
1. 主要参与搜索推荐、用户增长、零售等业务数据开发; 2. 参与实时、离线数据链路治理,通过数据治理与质量优化,支持业务提效; 3. 基于对业务理解和产品诉求的抽象,参与到面向业务应用的流批一体数据湖仓架构设计和研发落地; 4. 深入理解电商平台的业务,通过过程性数据分析,持续定位挖掘潜在问题,助力业务发展;
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
HDFS+
https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware.
https://www.ibm.com/cn-zh/think/topics/hdfs
Hadoop 分布式文件系统 (HDFS) 是一种管理大型数据集的文件系统,可在商用硬件上运行。
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
ClickHouse+
[英文] Advanced Tutorial
https://clickhouse.com/docs/tutorial
Learn how to ingest and query data in ClickHouse using the New York City taxi example dataset.
https://www.youtube.com/watch?v=FtoWGT7kS-c
ClickHouse is an open-source column-oriented DBMS for online analytical processing that allows users to generate analytical reports using SQL queries in real-time.
https://www.youtube.com/watch?v=Rhe-kUyrFUE&list=PL0Z2YDlm0b3gcY5R_MUo4fT5bPqUQ66ep
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
相关职位
社招5年以上技术类-数据
1、参与到本地生活PB级数据仓库的建设,通过构建本地生活商家数据中台,服务于数百万本地生活商家,提供丰富稳定的数据化产品服务; 2、参与到本地生活用户增长,构建丰富的人群标签库、数据产品和服务,助力业务产品不断优化,支持用增外投、承接、机制等全链路的数据建设 3、能基于准确性、及时性、稳定性的要求不断提高数据中台的质量和服务。
更新于 2025-09-23
社招3年以上技术类-数据
1. 主要参与搜索推荐、用户增长、零售等业务算法数据建设,通过实时、离线数据技术,支持算法样本、特征等开发工作; 2. 参与实时、离线数据链路治理,通过数据治理与质量优化,支持算法系统性能提升与成本优化; 3. 基于对业务理解和产品诉求的抽象,参与到面向业务应用的流批一体数据湖仓架构设计和研发落地; 4. 深入理解电商平台的算法超算业务,通过过程性数据分析,持续定位挖掘潜在问题,助力业务发展;
更新于 2025-08-04
社招技术类-开发
1、负责应对各种复杂业务场景的分布式文件系统的设计与研发,包含高可用高可靠高性能设计,文件系统核心 IO 栈的研发,参与数据路径和元数据路径的设计和研发。 2、负责分布式文件系统的稳定性工程,包括但不限于系统的可观测性、FaultTolerance、多租户 QoS系统研发。针对专属云网络隔离、专线带宽受限等特定风险,负责针对性的稳定性设计、SOP 和 演练。
更新于 2025-06-18