
智能互联淘宝闪购-数据研发专家-上海/杭州
社招全职5年以上技术类-数据地点:杭州 | 上海状态:招聘
任职要求
1、从事数据仓库领域3年以上,熟悉仓库模型设计与ETL开发,O2O领域数据建设经验优先; 2、掌握Kimball的维度建模设计方法,具备海量数据加工处理(ETL)相关经验,灵活运用SQL实现海量数据ETL加工处理,具备良好的SQL性能调优能力; 3、熟悉Hadoop生态相关技术并有相关实践经验,重点考察Hdfs、Mapreduce、Hive、Hbase、Spark; 4、熟悉数据仓库领域知识和技能者优先,包括但不限于:数据集市设计、元数据管理、数据质量、主数据管理; 5、掌握实时流计算技术,有F…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、参与到本地生活PB级数据仓库的建设,通过构建本地生活商家数据中台,服务于数百万本地生活商家,提供丰富稳定的数据化产品服务; 2、参与到本地生活用户增长,构建丰富的人群标签库、数据产品和服务,助力业务产品不断优化,支持用增外投、承接、机制等全链路的数据建设 3、能基于准确性、及时性、稳定性的要求不断提高数据中台的质量和服务。
包括英文材料
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
性能调优+
https://goperf.dev/
The Go App Optimization Guide is a series of in-depth, technical articles for developers who want to get more performance out of their Go code without relying on guesswork or cargo cult patterns.
https://web.dev/learn/performance
This course is designed for those new to web performance, a vital aspect of the user experience.
https://www.ibm.com/think/insights/application-performance-optimization
Application performance is not just a simple concern for most organizations; it’s a critical factor in their business’s success.
https://www.oreilly.com/library/view/optimizing-java/9781492039259/
Performance tuning is an experimental science, but that doesn’t mean engineers should resort to guesswork and folklore to get the job done.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
HDFS+
https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
The Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware.
https://www.ibm.com/cn-zh/think/topics/hdfs
Hadoop 分布式文件系统 (HDFS) 是一种管理大型数据集的文件系统,可在商用硬件上运行。
MapReduce+
https://www.youtube.com/watch?v=bcjSe0xCHbE
https://www.youtube.com/watch?v=cHGaQz0E7AU
In this video I explain the basics of Map Reduce model, an important concept for any software engineer to be aware of.
还有更多 •••
相关职位
社招2年以上技术类-开发
团队负责淘宝闪购爆品团、超抢手等核心业务的产品导购、交易、排序与定价相关系统的设计与研发落地。工作内容涵盖:通过工程化能力支持淘宝闪购核心商品业务产品的落地,以及商品排序、定价等AI大模型策略的研究、迭代与规模化应用,致力于打造智能化、高效率的商品导购C端产品技术体系。 岗位职责: 1. 独立完成中大项目的系统分析、设计,并主导完成详细设计和编码的任务,确保项目的进度和质量; 2. 能够在团队中完成Code Review的任务,确保相关代码的有效性和正确性,并能够通过Code Review提供相关性能以及安全的建议; 3. 设计与优化算法工程架构,提升算法迭代效率与质量。 4. 升级现有软件产品和系统,快速定位并修复现有软件缺陷。
更新于 2026-02-02杭州|上海
社招5年以上技术类-数据
1、参与到本地生活PB级数据仓库的建设,通过构建本地生活商家数据中台,服务于数百万本地生活商家,提供丰富稳定的数据化产品服务; 2、参与到本地生活用户增长,构建丰富的人群标签库、数据产品和服务,助力业务产品不断优化,支持用增外投、承接、机制等全链路的数据建设 3、能基于准确性、及时性、稳定性的要求不断提高数据中台的质量和服务。
更新于 2026-03-31杭州|上海
社招3年以上产品类-平台型
1、基于外卖餐饮、即时零售场景负责AI产品规划和定义,打造用户价值明确、行业领先的AI产品。 2、构建AI产品核心基础模块,例如统一UI框架、闲聊、人设、陪伴等。 3、高效协调研发、算法、UI/UX设计、测试、运营等团队资源,确保产品按时高质量交付上线。 4、定义AI产品的核心成功指标,建立数据监控和分析体系,并持续优化。
更新于 2026-03-25杭州|上海