TCL数据治理首席工程师(DE)(XQ250918007)
任职要求
1、计算机科学、人工智能、数据科学、工业工程、数学等相关专业,本科及以上学历,硕士/博士优先。 2、8年以上数据架构/AI数据方面建设经验,4年以上制造业相关领域经验。 3、深入理解分析式AI小模型及AI大模型(LLM、多模态 Transformer)的 训练/推理数据需求 4、精通数据湖、数据仓、Lakehouse 架构(Hive、Iceberg、Delta Lake 等) 5、熟悉多模态数据…
工作职责
负责AI数据的规划与架构,构建面向未来的多模态数据能力与AI数据供应链,确保数据资产可持续、高质量的支撑领域大模型及各类AI应用的落地与规模化复制
1、AI数据规划与架构设计
1.1 制定面向大模型与AI应用的数据建设蓝图与技术路线
1.2 设计支持多模态AI场景的数据架构(文本、图像、视频、时序数据等)
1.3 规划迭代AI数据供应体系,从数据采集、治理到特征服务的全链路
2、AI数据工程建设
2.1 建立面向 AI 训练/推理的高质量数据质量体系,推动数据源头应用/数据湖仓进行数据改进
2.2 设计多模态数据对齐与融合机制,满足大模型在训练、微调、推理阶段的输入需求
2.3 规划设计特征存储(Feature Store)、向量数据库及 Embedding Pipline的建设
2.4 制定自动标注、数据增强与弱监督等 AI 数据加工方法路径并推动落地1、负责字节跳动安全合规业务和团队管理,持续优化安全合规体系和效率,负责公司安全合规风险管控; 2、持续建立并优化安全合规相关制度、规范和指引,通过机制、流程和运营确保有效落地; 3、建立合规基线要求,通过制度、工具和能力对基线持续度量和治理; 4、通过数据分析识别关键差距,制定治理方案,不断优化和完善现有的安全策略,并在业务场景实施落地。
1、大数据环境数据治理体系的方案规划与实施,确保数据质量和数据安全、数据标准化; 2、主导数据标准、元数据管理、数据安全改造、数据字典及更新机制; 3、数据环境融合方案规划、执行计划以及落地实施; 4、开展数据质量评估与监控,识别并解决数据问题; 5、数据成本预算和治理,有效利用大数据存储资源和计算资源,降本增效; 6、探索数据资产价值量化评估方法,并对数据资产价值量化评估与治理。 7、推动数据治理工具的应用,优化数据治理流程,提升数据资产价值。
1.数据治理体系建设 - 制定并实施符合制造业业务需求的数据治理框架,涵盖数据质量、元数据、主数据、数据安全等领域。 - 设计数据分类、数据标准、数据生命周期管理策略,推动企业级数据资产目录的构建。 2.数据质量管理 - 识别制造业核心数据(如生产、供应链、设备、质量等数据)的质量问题,制定改进方案并推动落地。 - 建立数据质量监控指标和规则,定期输出数据质量报告,协调业务部门整改。 3.业务系统整合与标准化 - 梳理制造业核心系统(ERP、MES、SCM、CRM、IoT平台等)的数据模型,推动跨系统数据标准统一。 - 主导主数据(物料、供应商、客户、设备等)管理流程设计,确保主数据一致性。 4.数据安全与合规 - 制定数据访问权限策略,确保敏感数据(如工艺参数、客户信息)的合规使用。 - 配合法务部门满足国内外数据安全法规(如GDPR、中国数据安全法)要求。 5.跨部门协作与赋能 - 联合生产、供应链、质量等部门,推动数据治理文化落地,提升全员数据素养。 - 为业务部门提供数据治理工具(如元数据管理、数据血缘分析工具)的培训与支持。