蚂蚁金服蚂蚁集团-数据研发专家-ETL&建模型
社招全职5年以上技术类-数据地点:上海状态:招聘
任职要求
1、计算机、大数据、数学或统计学相关专业本科及以上学历,具有5年以上的工作经验; 2、具备丰富的数仓设计&开发经验,对实时计算有深刻理解,熟悉ETL分层建设及领域模型设计; 3、熟悉大数据生态相关技术,如:Hadoop/Hive/Spark/Flink/Storm/Kylin/Druid/Hb…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责蚂蚁公益和小游戏业务数据体系的规划设计和建设,使公益业务数据体系可持续发展,赋能业务数字化运营; 2、建立和优化离线及实时大数据体系,持续迭代数据模型设计和性能优化,提供统一、可靠的离线及实时数据服务; 3、负责端到端的提供数据解决方案,通过数据分析洞察、数据挖掘等方式支撑业务运营工作,协同上下游团队持续探索和沉淀数智化能力,助力业务目标达成。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
学历+
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招3-5年技术类-数据
1、负责蚂蚁全站研发数字化管理平台开发工作,提供数据挖掘引擎,指标管理,在线化报告,可视化分析等产品能力,通过对研发效能全量数据进行度量、洞察,辅助决策与改进,实现“数据驱动研发效能提升” 2、利用大模型、数据挖掘等技术从项目、需求、代码等研发数据资产中,构建起软件工程的业务、系统、部署架构,以全新的软件工程视角对传统研发效能基于数字的度量、分析进行价值扩展,帮助研发团队看清目标、战略,工程实施,系统运行状态,辅助研发团队提升软件工程研发效; 3、基于LLM的探索性数据分析系统研发,能够基于研发效能数据进行相关性、归因等数据分析,提供有价值的数据洞见和改进建议; 我们期待你的加入,一起打造业界领先的研发效能产品和技术
更新于 2025-07-24杭州
社招2年以上
1、负责核心业务域数据体系的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求 2、深度理解业务,通过对业务策略和痛点的分析,制定系统性端到端的数据解决方案并落地 3、负责数据资产建设、数据质量与稳定性管理,构建共享融通的数据平台,让数据标准更规范、数据获取更高效 4、探索Data for AI以及AI数据产品,利用大模型提升全链路数据应用效率
更新于 2025-11-17杭州
社招5年以上技术类-数据
1、参与到本地生活PB级数据仓库的建设,通过构建本地生活零售数据中台,服务于本地生活商家和用户,提供丰富稳定的数据化产品服务 2、参与到本地生活用户、商品、商户等核心资产建设,构建丰富的人群标签库、商品库、商机库等,助力业务产品不断优化 3、能基于准确性、及时性、稳定性的要求不断提高数据中台的质量和服务
更新于 2025-12-26北京|杭州