vivoAI数据工程师/专家
任职要求
1.本科及以上学历,计算机科学、数据科学、计算机视觉、摄影测量与遥感等相关专业。 2. 专业技能 数据处理能力: 精通图像数据处理工具链,熟悉RAW数据解析与色彩空间转换; 掌握主流标注工具及标注质量管理方法,熟悉业界标准数据集格式。 算法关联知识: 了解计算机视觉任务对数据的需求差异,能针对性地构建适配数据集; 熟悉数据增强技术及合成数据生成原理。 3. 经验要求 2年以上AI数据构建经验,主导过至少一个计算机视觉领域的高质量数据集建设项目; 有手机影像行业数据构建经验者优先,熟悉手机多摄标定数据、ISP调试数据特性者优先。 4. 软性素质 具备极强的数据敏感性,能通过数据分析发现采集偏差或标注缺陷; 优秀的跨团队协作能力,能高效对齐算法、产品、法务等多方需求; 注重流程标准化,擅长编写数据规范文档与SOP操作手册。 5. 加分项 掌握生成式AI工具用于数据合成; 有开源数据集贡献经历(如竞赛数据集、学术机构合作项目)。
工作职责
1.数据采集方案设计 根据影像算法需求,设计多场景、多维度数据采集方案,覆盖不同光照条件、设备类型及环境变量。 制定传感器参数配置标准,确保原始数据的高信噪比与色彩保真度。 2.数据增强与合成 开发基于物理模型的数据增强工具,扩充数据多样性; 利用生成式AI技术(如GAN、NeRF)合成稀缺场景数据,解决长尾数据分布问题。 数据质量评估与闭环 设计数据质量评价体系,通过算法预筛选+人工复核确保数据质量达标; 建立数据-算法协同优化闭环,根据模型训练效果反向迭代数据采集策略。 3.数据资产管理与合规 构建企业级影像数据库,设计高效检索系统,实现数据版本化管理与权限控制; 确保数据采集符合隐私保护与版权合规要求,制定数据安全使用规范。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
1.负责离线和实时数据仓库各层(如ODS、DWD、DWS、ADS)的模型设计、开发与优化,支撑数据分析和业务应用; 2.负责集团财务数据分析系统的数仓开发及报表开发; 3.独立完成复杂业务逻辑的数据ETL开发、任务调度与运维监控,保障数据加工流程的准确性和稳定性; 4.建立并监控数据质量规则,主动发现、跟踪并解决数据质量问题,确保数据的可靠性和可信度。
工作内容: 1.负责策划大数据如何赋能业务研发,协助专业领域提供数据和工具支持; 2.负责动力业务工具链开发,赋能业务提效; 3.负责通过AI算法赋能动力业务,推动业务高效发展; 4.负责多模态数据(文本、图像、音频)采集、清洗、预处理;
1、负责夸克AI业务相关的数据分析工作,包括不限于影响功能体验提升与增长的因素,渗透及留存的归因等; 2、对于业务有深度思考,进而转变为关键指标的搭建和监控,对短期异常进行归因,对长期趋势进行解读形成洞察; 3、基于业务迭代和分析需要,完善数据建设;通过合理的AB实验方案及分析方法等,清晰客观的看清用户体验的变化,进而提出有针对性的解决方案,协助产品提升用户使用体验; 4、通过动线分析、因果推断等科学的方法,对业务做专项分析;帮助业务理解业务发过程中的关键现象和问题,形成有效认知和干预手段; 5、主动发现业务本质的需要和痛点,找到可改进/提效的机会,给出具体可行的优化建议,推进落地并带来业务实际提升;