蚂蚁金服蚂蚁集团-高级数据开发工程师-财保
社招全职3年以上技术类-数据地点:上海 | 杭州状态:招聘
任职要求
1.3年以上工作经验,计算机等相关专业本科以上学历 ,具有丰富的数据建模实践经验; 2.精通业务建模、数据仓库建模、精通ETL设计开发,具备体系化的数据质量与数据治理相关经验,有大型项目相关领域深入实践经验,能独立主导完成某一业务领域的整体模型设计,具备跨域的沟通协调能; 3.精通hadoop/yarn/hive等大数据体系,深入了解背后的实现原…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责蚂蚁财富、保险业务线数据体系和解决方案建设,赋能业务数字化运营,提升运营效率,保障数据的质量和稳定性; 2.负责业务领域核心数据体系的规划,以数据为核心生产要素制定数据解决方案,解决业务开展过程中遇到的痛点,包括但不限于用户标签体系、数据智能化和自动化体系和实时数据体系的建设; 3.负责建设高质量的领域数据资产,包括但不限于外部数据引入、数据标注、特征挖掘等,为业务智能化营销、大模型等智能化场景,提供必要的模型训练、迭代、部署等方面的支持,确保业务智能化升级目标能够顺利推进、落地; 4.负责主导或参与数据治理工作,实现持续、低成本的产出高质量的数据;建设数据内部共享融通的数据平台,保障数据的合规使用,避免数据泄漏及违规使用。
包括英文材料
学历+
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
ETL+
https://www.ibm.com/think/topics/etl
ETL—meaning extract, transform, load—is a data integration process that combines, cleans and organizes data from multiple sources into a single, consistent data set for storage in a data warehouse, data lake or other target system.
https://www.youtube.com/watch?v=OW5OgsLpDCQ
It explains what ETL is and what it can do for you to improve your data analysis and productivity.
数据治理+
https://www.ibm.com/think/topics/data-governance
Data governance is the data management discipline that focuses on the quality, security and availability of an organization’s data.
https://www.youtube.com/watch?v=uPsUjKLHLAg
Building data fabric eliminates the technological complexities of data governance so users can connect to the right data at the right time, regardless of where it resides.
Hadoop+
https://www.runoob.com/w3cnote/hadoop-tutorial.html
Hadoop 为庞大的计算机集群提供可靠的、可伸缩的应用层计算和存储支持,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集,并且支持在单台计算机到几千台计算机之间进行扩展。
[英文] Hadoop Tutorial
https://www.tutorialspoint.com/hadoop/index.htm
Hadoop is an open-source framework that allows to store and process big data in a distributed environment across clusters of computers using simple programming models.
Yarn+
[英文] Introduction
https://yarnpkg.com/getting-started
Yarn is an established open-source package manager used to manage dependencies in JavaScript projects.
Hive+
[英文] Hive Tutorial
https://www.tutorialspoint.com/hive/index.htm
Hive is a data warehouse infrastructure tool to process structured data in Hadoop. It resides on top of Hadoop to summarize Big Data, and makes querying and analyzing easy.
https://www.youtube.com/watch?v=D4HqQ8-Ja9Y
还有更多 •••
相关职位
社招3年以上技术类-安全
1.负责蚂蚁集团财保线数据安全及个人隐私保护安全技术体系建设及运营工作; 2.负责蚂蚁集团财保线生态数据安全风险治理的安全技术方案规划、设计和实施及运营; 3.负责蚂蚁集团财保线数据安全风险感知、审计及处置能力的开发建设,通过数据化、产品化的方法优化相关机制及流程。
更新于 2025-09-16杭州
社招1-3年网易有道
1. 参与升学中心数据仓库设计与研发,完成数据建模的设计和开发以及数据监控,性能优化等相关技术工作 2. 结合升学中心业务特点,进行指标/标签体系的搭建 3. 参与数仓研发质量保障体系的完善和实施,打造稳定可靠的数据服务和保障体系 4. 调研和跟进大数据技术发展趋势进行相关数据方案的探索落地 5. 编写和维护数仓文档
更新于 2025-04-03北京
社招技术类
1、负责公司内视频云业务数据的开发和维护,为点直播业务与视频云研发团队提供快速、准确、灵活的数据仓库支持; 2、深入理解业务逻辑,完成数据模型设计及优化工作; 3、完成海量数据的获取、清洗、分类、整合等数据处理工作; 4、设计并实现对BI分析及报表展现、数据产品开发; 5、独立完成数据问题的排查与处理,解决数据质量与性能问题;
更新于 2025-02-13上海