logo of tcl

TCL数据治理资深工程师(XQ250918009)

社招全职5年以上职能平台类地点:深圳状态:招聘

任职要求


1、计算机科学、软件工程、数据科学、数学、人工智能等相关专业,本科及以上学历,硕博士优先
2、5 年以上 数据工程 / AI 数据处理经验,2 年以上 制造业或工业互联网数据项目经验。
3、精通 Python / SQL 及常用大数据处理框架(SparkFlinkAirflowKafka)
4、熟悉多模态数据处理流程(图像、视频、时间序列、CAD/3D、文本),并能实现跨模态对齐…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责制造业 AI 数据基座 的工程化建设与落地,实现从数据采集、治理、加工到 AI Ready 数据服务的全链路,支撑领域大模型及其他 AI 应用的落地。

1、数据预处理与质量提升
     1.1 设计自动化数据清洗、异常检测、缺失补全、去噪与归一化流程
     1.2 开发 多模态数据解析与对齐 工具链(CAD 文件解析、工业图像与工艺文本对齐、传感器信号同步)
    1.3 建立持续化数据质量监控与回溯机制,确保训练数据的稳定性与一致性
2、AI 数据加工与标注
    2.1 搭建和维护数据标注平台(CVAT、Label Studio 等),并实现批量标注自动化
    2.2 开发数据增强、弱监督、半监督等 AI 数据扩充方法,提高数据多样性与泛化能力
    2.3 支持合成数据(Synthetic Data)生成与验证
3、特征工程与向量化处理
    3.1 开发特征提取、Embedding 生成与向量化存储(Milvus、FAISS、Pinecone 等)
    3.2 建设 Feature Store,为大模型训练、RAG(检索增强生成)与实时推理提供高质量特征数据流
4、数据服务化与API开发
   4.1 构建标准化数据 API、特征查询接口及实时数据流服务,供算法与应用调用
   4.2 优化数据访问性能、扩展性与安全性,支持高并发 AI 场景
包括英文材料
数据科学+
学历+
Python+
SQL+
Spark+
Airflow+
Kafka+
还有更多 •••
相关职位

logo of digitalchina
社招5年以上

1、负责对外部客户提供数字化转型服务,包含数字化规划、业务分析、行业应用、信息服务平台、大数据平台等咨询及项目实施; 2、能够独立或者带团队为客户制定数字化转型目标、制定数据能力解决方案、包括数据需求梳理、数据模型构建、数据整合加工处理和数据能力供给方案; 3、能够独立或者带团队完成客户需求理解和挖掘,完成大数据解决方案的规划、选型、POC和组织、以及项目交付实施等。

更新于 2023-08-15深圳
logo of bytedance
社招3年以上L5000

1、主导财经业务相关主题的分布式数据仓库规划、设计、落地及运营; 2、主导财经数据资产公共层建设,从工具和效果上实现敏捷智能的目标; 3、深入了解业务,主动优化数据仓库实现数据治理与迭代闭环,不断提升数据质效。

更新于 2022-11-01北京
logo of shein
社招10年以上信息技术类

1、系统架构设计与治理:负责公司财务系统的架构设计和治理,打造高质量、稳定可靠的系统,确保财务数据的准确性和完整性。 2、标准规范与执行:制定并执行研发标准和规范,通过强化抽象思维和系统方法保障系统的持续稳定性。 3、业务理解与技术落地:深入理解财务业务需求,具备财务领域知识,能够分析产品需求并进行技术设计和实施。 4、技术探索与创新:识别技术改进机会,探索在高并发处理、存储性能优化、数据一致性保障等方面的技术突破。 5、产品能力与持续优化:设计和完善产品的技术架构,解决关键问题,并形成整体改进方案。持续推动系统进化,保障财务数据的可靠性。 6、前瞻性技术研究:持续优化系统架构,调研业内新技术方案,基于业务发展需求进行前瞻性思考和设计。

更新于 2025-11-07南京
logo of ctrip
社招5年以上旅游业务AI &

参与离线和实时数据仓库架构设计和开发,构建高效、稳定、可扩展的数据仓库系统。 负责数据仓库模型设计,包括星型模型、雪花模型、星座模型等,并制定数据仓库开发规范。 负责数据资产的运营,结合业务现状,解决数据资产生产、消费过程中的卡点,提升相关团队的用数体验 开发和维护 ETL/ELT 数据 pipeline,确保数据高效、准确地从源系统加载到数据仓库 优化数据仓库性能,解决数据查询和数据加载的性能瓶颈。

更新于 2025-02-26上海