滴滴资深数据治理工程师(J250910006)
任职要求
1、本科及以上学历,计算机、金融、数学等相关专业,5年以上工作经验。 2、熟悉数据治理理论及实践,具备互联网公司数据治理经验; 3、熟悉数据仓库,具备较强的数据分析能…
工作职责
1、大数据环境数据治理体系的方案规划与实施,确保数据质量和数据安全、数据标准化; 2、主导数据标准、元数据管理、数据安全改造、数据字典及更新机制; 3、数据环境融合方案规划、执行计划以及落地实施; 4、开展数据质量评估与监控,识别并解决数据问题; 5、数据成本预算和治理,有效利用大数据存储资源和计算资源,降本增效; 6、探索数据资产价值量化评估方法,并对数据资产价值量化评估与治理。 7、推动数据治理工具的应用,优化数据治理流程,提升数据资产价值。
1、能够独立负责金融某一业务板块实时数据仓库与离线数据仓库的需求管理、架构设计、模型建设和数据研发工作,保证数据服务的稳定性和准确性; 2、能够对数据仓库团队初级人员在数据仓库建模、数据治理、金融业务等方向进行指导; 3、能够通过数据资产治理、数据需求交付时效提升等方式实现数据仓库工作的降本提效。 4、能够与上下游紧密协作,为金融商业分析、业务决策、业务运营、数据产品等提供有效数据支撑,对业务赋能; 5、能够与行业先进的数据技术对标,采用最佳技术实践解决业务数据需求痛点。
1. 负责滴滴网约车核心业务的数据仓库搭建及开发, 进行领域数仓建模并持续优化,持续提升数据效率; 2. 负责抽象核心业务流程,沉淀好用的数据架构、通用的分析框架和数据应用产品; 3. 负责数据开发流程及架构优化,不断完善数据治理体系,持续提升数仓建设的质量; 4. 探索新技术应用,实现技术变革升级
1. 数据安全风险治理:负责指定方向的数据安全防护体系建设,全面识别该方向的数据安全风险,针对性的制定可落地的治理方案和整体防护体系;联动产研、业务、以及信安各团队,推动相关方案和体系落地及运转; 2 数据安全管理体系建设: 跟踪最新数据安全相关法律法规要求,持续优化内部数据安全管理及合规体系,与监管及检测机构积极沟通,确保数据安全合规; 3. 数据安全产品建设:参考业内实践及AI技术,制定数据安全风险治理产品规划,协同产研团队,建设数据安全风险治理量化平台 。
负责制造业 AI 数据基座 的工程化建设与落地,实现从数据采集、治理、加工到 AI Ready 数据服务的全链路,支撑领域大模型及其他 AI 应用的落地。 1、数据预处理与质量提升 1.1 设计自动化数据清洗、异常检测、缺失补全、去噪与归一化流程 1.2 开发 多模态数据解析与对齐 工具链(CAD 文件解析、工业图像与工艺文本对齐、传感器信号同步) 1.3 建立持续化数据质量监控与回溯机制,确保训练数据的稳定性与一致性 2、AI 数据加工与标注 2.1 搭建和维护数据标注平台(CVAT、Label Studio 等),并实现批量标注自动化 2.2 开发数据增强、弱监督、半监督等 AI 数据扩充方法,提高数据多样性与泛化能力 2.3 支持合成数据(Synthetic Data)生成与验证 3、特征工程与向量化处理 3.1 开发特征提取、Embedding 生成与向量化存储(Milvus、FAISS、Pinecone 等) 3.2 建设 Feature Store,为大模型训练、RAG(检索增强生成)与实时推理提供高质量特征数据流 4、数据服务化与API开发 4.1 构建标准化数据 API、特征查询接口及实时数据流服务,供算法与应用调用 4.2 优化数据访问性能、扩展性与安全性,支持高并发 AI 场景