富途数据架构师(Data Domain Architect)
社招全职8-10年技术类地点:深圳状态:招聘
任职要求
1. 8-10年数据开发/数据架构相关工作经验,其中至少3年数仓架构设计或Tech Lead经验2. 精通数据仓库建模理论(维度建模、Data Vault等),有从0到1搭建或重构数据域的成功经验3. 精通SQL,熟练掌握至少一种大数据计算引擎(Spark / Hive / Presto),有处理TB级数据的实战经验4. 熟练掌握Flink/FlinkSQL实时计算能力,有大规模线上实时系统优化经验5. 熟悉主流大数据技术栈(Hive / Iceberg / Kafka / Airflow等),具备技术选型和方案评估能力6. 具备出色的业务理解能力,能快速学习新业务领域并建立对应的数…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位概述作为数据域Owner,你将全面负责一个核心数据域(交易域 / 资产域 / 增长域 / 运营域 / 合规域 / 用户域,具体方向根据背景匹配)的架构设计、数据质量、资产管理和团队建设。你既是这个域的"技术总架构师",也是域内数据资产的第一责任人,带领2-4人的小团队,端到端服务对应的业务线。1、架构设计(40%)- 负责所管辖数据域的整体数据架构设计,包括分层模型(ODS→DWD→DWS→ADS)、主题域划分、维度建模- 制定域内数据规范(命名规则、字段标准、SLA分级),确保模型的可扩展性和可复用性- 主导域内重大技术方案评审和设计决策,把控核心数据表的模型质量- 规划域内技术演进路线(如Iceberg迁移、实时化改造、多市场扩展等),持续降低技术债务2、质量与稳定性(20%)- 建立域内数据质量保障体系,制定关键表的数据质量规则(完整性、准确性、一致性、时效性)- 对域内所有数据资产的准确性负最终责任,建立问题发现→定位→修复→复盘的闭环机制- 负责域内核心任务的稳定性保障,确保关键报表、数据按时产出3、业务协作与需求管理(25%)- 深入理解对应业务线的核心逻辑和数据需求,成为业务与数据之间的"翻译官"- 管理域内需求优先级,协调中间层开发和业务BP的工作排期- 主动识别业务痛点,提出数据驱动的优化建议,从被动响应转向主动赋能- 参与跨域协作,与其他域Owner对齐数据口径、依赖关系和变更通知4、团队管理与人才培养(15%)- 带领域内2-4名开发人员(含中间层开发和业务BP),进行工作分配、Code Review和技术辅导- 负责域内成员的成长规划,建立域内知识库和文档体系
包括英文材料
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
数据仓库+
https://www.youtube.com/watch?v=9GVqKuTVANE
From Zero to Data Warehouse Hero: A Full SQL Project Walkthrough and Real Industry Experience!
https://www.youtube.com/watch?v=k4tK2ttdSDg
Vault+
[英文] Tutorials | Vault
https://developer.hashicorp.com/vault/tutorials
Centrally store, access and deploy secrets
https://www.youtube.com/watch?v=klyAhaklGNU
Full HashiCorp Vault Tutorial explaining What is HashiCorp Vault, How Vault works, Vault Architecture
SQL+
https://liaoxuefeng.com/books/sql/introduction/index.html
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。
https://sqlbolt.com/
Learn SQL with simple, interactive exercises.
https://www.youtube.com/watch?v=p3qvj9hO_Bo
In this video we will cover everything you need to know about SQL in only 60 minutes.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
还有更多 •••