蚂蚁金服蚂蚁集团-数据研发专家-杭州
社招全职3年以上技术类-数据地点:杭州状态:招聘
任职要求
1.计算机、软件工程等相关理工科专业背景,本科及以上学历, 3年以上工作经验,具有丰富的数据建模与实践经验 2.精通业务建模、数据仓库建模设计开发,具备体系化的数据质量与数据治理相关经验,有大型项目实践经验,能独立主导完成某一业务领域的整体模型设计与落地 3.掌握离线(Hive/Spark)或者实时(Flink)数据研发技术体系及底层原理,有丰富的相关项目…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责消费信贷贷后数据架构和指标体系建设,基于业务理解完成数据建模及数据指标体系设计开发,发现洞察业务问题和机会,沉淀精品数据资产和抽象数据产品提升业务效能 2.深入理解业务的策略打法,敏锐洞察业务痛点,利用数据技术和数据科学手段为业务决策、增长策略提供专业化的离在线数据解决方案,助力万亿级规模的信贷业务高速且稳健的发展 3.负责数据质量、稳定性、计存治理等数据治理工作,让数据标准更规范、数据获取更高效、数据链路具备更好的可扩展性和可维护性
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
数据治理+
https://www.ibm.com/think/topics/data-governance
Data governance is the data management discipline that focuses on the quality, security and availability of an organization’s data.
https://www.youtube.com/watch?v=uPsUjKLHLAg
Building data fabric eliminates the technological complexities of data governance so users can connect to the right data at the right time, regardless of where it resides.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
还有更多 •••
相关职位
社招2年以上
1、负责核心业务域数据体系的规划和建设,通过数据产品和数据服务等方式,高效支撑业务场景的数据需求 2、深度理解业务,通过对业务策略和痛点的分析,制定系统性端到端的数据解决方案并落地 3、负责数据资产建设、数据质量与稳定性管理,构建共享融通的数据平台,让数据标准更规范、数据获取更高效 4、探索Data for AI以及AI数据产品,利用大模型提升全链路数据应用效率
更新于 2025-11-17杭州
社招技术类-数据
1、大规模预训练数据处理链路设计与开发,涵盖多源数据自动化采集抓取和解析,为基座模型预训练筑牢高质量数据根基。 2、深入探索前沿模型,构建先进的数据合成方案与框架,融合大模型与创新算法,生成海量、高质量且多样化的合成数据,有效拓展数据规模与维度,满足大模型训练对数据的需求。 3、深度剖析大模型训练数据特性,提高模型训练数据的可解释性,提升大模型算法工程师的数据处理消费效率,加速模型研发迭代进程。 4、建设基于业务体系的数据资产模型,通过合理高效全面的数据资产储备来提升运营迭代和算法迭代效率。 5、搭建数据质量监控体系,保障数据真实、准确、合规。 6、跟踪行业前沿技术,推动数据处理技术在大模型研发中的深度应用与创新落地。
更新于 2025-07-16杭州
社招3年以上技术类-数据
1)熟悉隐私安全法律法规,制定数据风险管理领域的解决方案。让蚂蚁业务数据安全、合规、高效流动.; 2)负责风险领域相关数据资产建设,数据化指引/落地风险管理治理工作; 3)能够主动推动安全合规技术以及产品平台的不断迭代优化,主导能力在业务侧的推广运营落地。
更新于 2025-09-23杭州