蚂蚁金服蚂蚁集团-数据技术工程师/专家-蚂蚁星河
社招全职3年以上技术类-数据地点:杭州状态:招聘
任职要求
1、5年以上工作经验,计算机等相关专业本科以上学历 ,具有丰富的数据建模实践经验; 2、精通业务建模、数据仓库建模、精通ETL设计开发,具备体系化的数据质量与数据治理相关经验,有大型项目相关领域深入实践经验,能独立主导完成某一业务领域的整体模型设计,具备跨域的沟通协调能; 3、精通hadoop/yarn/hive等大数据体系,深入了解起背后的实现…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责蚂蚁星河数据体系和解决方案建设,赋能流量分配,机构服务,资产管理,风控管理等业务,保障数据的质量和稳定性; 2、负责业务领域核心数据体系的规划设计。在数据技术上,能结合业界技术探索数据服务的增量。在数据化运营和数据能力产品化上,制定数据技术和服务的策略。包括用户标签体系、数据智能化和自动化体系和实时数据体系的建设; 3、规划设计数据服务工具,提升数据研发的工作效率,搭建数据服务的工具/产品,赋能业务同学和业务产品,灵活支撑业务的创新和探索,让数据价值更浸透; 4、负责数据质量、稳定性等数据管理,数据内部共享融通的数据平台,让数据标准更规范、数据获取更高效。
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
数据治理+
https://www.ibm.com/think/topics/data-governance
Data governance is the data management discipline that focuses on the quality, security and availability of an organization’s data.
https://www.youtube.com/watch?v=uPsUjKLHLAg
Building data fabric eliminates the technological complexities of data governance so users can connect to the right data at the right time, regardless of where it resides.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Yarn+
[英文] Introduction
https://yarnpkg.com/getting-started
Yarn is an established open-source package manager used to manage dependencies in JavaScript projects.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招3年以上技术类-开发
1. 参与蚂蚁星河金融AI应用设计和开发,支持大模型研发训练以及在业务场景的应用落地 2. 负责信贷/资管/金市投研/营销等场景大模型应用场景的落地建设,以及相关AI平台系统的架构设计与开发; 3. 负责大模型性能分析和进行调优,识别和解决瓶颈问题,包括不限模型微调训练和模型评测等,提升模型效果和推理速度;
更新于 2025-10-30杭州|重庆
社招3年以上技术类-开发
1、负责蚂蚁钱包科技用户增长领域相关数据资产建设,数据化指引/数据治理工作;沉淀营销、流量等业务的优质数据资产,打造用户增长领域高质量、高复用的精品指标。 2、熟悉隐私安全法律法规,制定数据风险管理领域的解决方案。规划业务大图和主要流程、针对复杂的业务问题能做提炼和拆解,帮助数据安全、合规、高效流转。 3、帮助海外钱包建设指标体系和经营分析体系,提升海外钱包客户经营效率
更新于 2025-09-01杭州