TCL数据治理资深工程师(XQ241209008)
任职要求
1、根据具体项目的需求,具备相关制造领域AI模型及数据标注、运营的知识; 2、熟悉使用数据标注工具和软件,能够高效地进行数据标注和管理; 3、愿意学习新的标注技术和工具; 4、具备质量控制的意…
工作职责
1、数据标注:对文本、图像、语音等数据进行标注。包括使用标注工具对各类数据进行标记和清理,确保标注结果的准确性和合格率; 2、数据清洗和整理:负责根据产品需求进行相关数据的清洗和整理工作,如客户信息、用户行为等,保证数据的准确性和完整性; 3、数据质量监督:对数据质量进行监督,发现异常问题及时解决处理,确保数据的准确性和可靠性; 4、数据转换:负责将原始数据转换为可执行的格式,配合产品经理完成相关分析报表制作及报告撰写; 5、工具使用和维护:熟悉并使用数据标注工具,理解标注规则,根据培训和实际工作要求改进工作方法。协助完善标注工具,建立词库,定期提交工作报告; 6、根据数据标注经验开发自动化脚本或利用其它工具提升工作效率(高阶要求,不强制具备)。
1、数据标注:对文本、图像、语音等数据进行标注。包括使用标注工具对各类数据进行标记和清理,确保标注结果的准确性和合格率; 2、数据清洗和整理:负责根据产品需求进行相关数据的清洗和整理工作,如客户信息、用户行为等,保证数据的准确性和完整性; 3、数据质量监督:对数据质量进行监督,发现异常问题及时解决处理,确保数据的准确性和可靠性; 4、数据转换:负责将原始数据转换为可执行的格式,配合产品经理完成相关分析报表制作及报告撰写; 5、工具使用和维护:熟悉并使用数据标注工具,理解标注规则,根据培训和实际工作要求改进工作方法。协助完善标注工具,建立词库,定期提交工作报告; 7、根据数据标注经验开发自动化脚本或利用其它工具提升工作效率(高阶要求,不强制具备)。
负责制造业 AI 数据基座 的工程化建设与落地,实现从数据采集、治理、加工到 AI Ready 数据服务的全链路,支撑领域大模型及其他 AI 应用的落地。 1、数据预处理与质量提升 1.1 设计自动化数据清洗、异常检测、缺失补全、去噪与归一化流程 1.2 开发 多模态数据解析与对齐 工具链(CAD 文件解析、工业图像与工艺文本对齐、传感器信号同步) 1.3 建立持续化数据质量监控与回溯机制,确保训练数据的稳定性与一致性 2、AI 数据加工与标注 2.1 搭建和维护数据标注平台(CVAT、Label Studio 等),并实现批量标注自动化 2.2 开发数据增强、弱监督、半监督等 AI 数据扩充方法,提高数据多样性与泛化能力 2.3 支持合成数据(Synthetic Data)生成与验证 3、特征工程与向量化处理 3.1 开发特征提取、Embedding 生成与向量化存储(Milvus、FAISS、Pinecone 等) 3.2 建设 Feature Store,为大模型训练、RAG(检索增强生成)与实时推理提供高质量特征数据流 4、数据服务化与API开发 4.1 构建标准化数据 API、特征查询接口及实时数据流服务,供算法与应用调用 4.2 优化数据访问性能、扩展性与安全性,支持高并发 AI 场景
1、负责业务领域数据现状梳理,参与端到端数据方案设计, 2、负责数字化项目中数据工作,协同DO/DC制定数据标准,推动数据模型及标准的实施,跟进数据入湖及资产注册落地实施; 3、识别领域核心数据,制定质量规则及监控任务,针对问题协同业务进行改善,提高数据质量。
