vivoAI数据工程师/专家
任职要求
1.本科及以上学历,计算机科学、数据科学、计算机视觉、摄影测量与遥感等相关专业。 2. 专业技能 数据处理能力: 精通图像数据处理工具链,熟悉RAW数据解析与色彩空间转换; 掌握主流标注工具及标注质量管理方法,熟悉业界标准数据集格式。 算法关联知识: 了解计算机视觉任务对数据的需求差异,能针对性地构建适配数据集; 熟悉数据增强技术及合成数据生成原理。 3. 经验要求 2年以上AI数据构建经验,主导过至少一个计算机…
工作职责
1.数据采集方案设计 根据影像算法需求,设计多场景、多维度数据采集方案,覆盖不同光照条件、设备类型及环境变量。 制定传感器参数配置标准,确保原始数据的高信噪比与色彩保真度。 2.数据增强与合成 开发基于物理模型的数据增强工具,扩充数据多样性; 利用生成式AI技术(如GAN、NeRF)合成稀缺场景数据,解决长尾数据分布问题。 数据质量评估与闭环 设计数据质量评价体系,通过算法预筛选+人工复核确保数据质量达标; 建立数据-算法协同优化闭环,根据模型训练效果反向迭代数据采集策略。 3.数据资产管理与合规 构建企业级影像数据库,设计高效检索系统,实现数据版本化管理与权限控制; 确保数据采集符合隐私保护与版权合规要求,制定数据安全使用规范。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
1.负责离线和实时数据仓库各层(如ODS、DWD、DWS、ADS)的模型设计、开发与优化,支撑数据分析和业务应用; 2.负责集团财务数据分析系统的数仓开发及报表开发; 3.独立完成复杂业务逻辑的数据ETL开发、任务调度与运维监控,保障数据加工流程的准确性和稳定性; 4.建立并监控数据质量规则,主动发现、跟踪并解决数据质量问题,确保数据的可靠性和可信度。
1. 构建UGC违规样本数据体系(文本、图片、用户行为); 2. 设计与维护数据加工流程(清洗、去噪、去重、标注、标签管理); 3. 搭建AI训练数据回流系统(人工纠错 → 样本更新 → 模型优化); 4. 建设内容风控指标体系(准确率、漏判率、错杀率、人工介入率); 5. 支持AI模型评估、版本对比与效果复盘; 6. 构建可复用数据资产管理系统; 7. 设计及维护审核系统的数据底层支撑; 8. 配合策略专家沉淀高质量违规样本库。