阿里巴巴1688-数据研发专家-杭州
社招全职地点:杭州状态:招聘
任职要求
1.有从事数据仓库领域经验,熟悉数据仓库模型设计&ETL,有海量数据处理经验,有电商领域数据建设经验优先 2.熟悉大数据技术,包括但不局限于:数据集市设计、实时计算、数据管理、数据质量、数据服务等; 3.对数据敏感,具备良好的业务理解、数据分析和解决方案能力,对将数据技术应用到实际业务场景产生商业价值具有强烈的热情 4.具备较好的自我驱动和抗压能力,良好的沟通能力和团队合作精神,有一定的组织协调能力 5.熟悉Hadoop生态相关技术,SQL熟练并具备一定的Python开发能力,有过大模型相关经验优先
工作职责
1、负责核心业务域数据体系的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求 2、深度理解业务,通过对业务策略和痛点的分析,制定系统性端到端的数据解决方案并落地 3、负责数据资产建设、数据质量与稳定性管理,构建共享融通的数据平台,让数据标准更规范、数据获取更高效 4、探索Data for AI以及AI数据产品,利用大模型提升全链路数据应用效率
包括英文材料
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招技术类-数据
1、大规模预训练数据处理链路设计与开发,涵盖多源数据自动化采集抓取和解析,为基座模型预训练筑牢高质量数据根基。 2、深入探索前沿模型,构建先进的数据合成方案与框架,融合大模型与创新算法,生成海量、高质量且多样化的合成数据,有效拓展数据规模与维度,满足大模型训练对数据的需求。 3、深度剖析大模型训练数据特性,提高模型训练数据的可解释性,提升大模型算法工程师的数据处理消费效率,加速模型研发迭代进程。 4、建设基于业务体系的数据资产模型,通过合理高效全面的数据资产储备来提升运营迭代和算法迭代效率。 5、搭建数据质量监控体系,保障数据真实、准确、合规。 6、跟踪行业前沿技术,推动数据处理技术在大模型研发中的深度应用与创新落地。
更新于 2025-07-16
社招3年以上技术类-数据
1)熟悉隐私安全法律法规,制定数据风险管理领域的解决方案。让蚂蚁业务数据安全、合规、高效流动.; 2)负责风险领域相关数据资产建设,数据化指引/落地风险管理治理工作; 3)能够主动推动安全合规技术以及产品平台的不断迭代优化,主导能力在业务侧的推广运营落地。
更新于 2025-09-23
社招5年以上技术类-数据
1、参与到本地生活PB级数据仓库的建设,通过构建本地生活零售数据中台,服务于本地生活商家和用户,提供丰富稳定的数据化产品服务 2、参与到本地生活用户、商品、商户等核心资产建设,构建丰富的人群标签库、商品库、商机库等,助力业务产品不断优化 3、能基于准确性、及时性、稳定性的要求不断提高数据中台的质量和服务
更新于 2025-09-24