
哈啰智驾系统数据闭环工具链开发专家
任职要求
1、5年以上软件开发经验,拥有计算机科学,电气工程或相关专业技术硕士或以上学历; 2、熟练应用Python、c++等编程语言,具有丰富的多线程、并发编程实战经验; 3、熟悉常用数据结构及设计模式、能够独立完成模块的设计开发及性能调优; 4、具有Linux或QNX平台软件开发经验,熟悉内核基本原理、对内核核心模块如内存管理、进程调度及文件系统等开关代码有一定程度的研究经验者优先; 5、具有智能驾驶相关中间件使用检验优先(如Apolloos、ros等); 6、有智能驾驶行业数据工具链开发经验优先。
工作职责
1、负责自动驾驶大数据平台系统中的数据仓库建设,含数据处理,数据存储,数据工具等的开发和优化; 2、负责场景化数据挖掘、数据评估、模型训练系统的设计和开发; 3、负责车辆车端数据采集、数据回传相关软件开发工作; 4、负责数据体系相关数据的抽取、清洗、转换、服务、接口对接等工作; 5、负责所开发软件的性能优化相关工作以及相关开发文档的撰写。

1、负责智驾数据闭环整体产品规划及方案设计,完成数据场景需求收集、数据存储、数据挖掘、数据标注、数据管理、模型训练、模型评测、仿真评测等工具链需求设计,支持智驾的快速迭代; 2、识别数据闭环涉及的法规要求,明确数据存储、传输、处理等环节的合规标准,制定合规策略,包括数据分类分级、加密要求、访问控制规则等; 3、负责智驾相关的竞品分析和市场调研,收集用户需求并分析痛点,剔除改进方案,提升产品力。

1、负责自动驾驶大数据平台系统中的数据仓库建设,含数据处理,数据存储,数据工具等的开发和优化; 2、负责场景化数据挖掘、数据评估、模型训练系统的设计和开发; 3、负责车辆车端数据采集、数据回传相关软件开发工作; 4、负责数据体系相关数据的抽取、清洗、转换、服务、接口对接等工作; 5、负责所开发软件的性能优化相关工作以及相关开发文档的撰写。

1、数据闭环体系搭建与落地:负责自动驾驶全链路数据闭环体系设计与搭建,日均处理亿级传感器原始数据及标注数据,保障数据从采集、处理到模型训练的端到端流转,支撑感知、决策规划等端到端模型的高效训练; 2、数据闭环工具链研发: 2.1 云端数据处理 pipeline 开发: •针对标注数据、场景数据,设计并落地数据清洗(去噪、去重、异常过滤)、解析、切片、抽帧、送标(对接标注平台)的全流程自动化 pipeline; •优化 pipeline 吞吐量与延迟,目标支撑日均 10 万 + 场景数据处理,服务算法团队数据生产需求; •推动工具链部署落地,解决线上运行故障(如数据阻塞、接口兼容问题),保障工具链可用性。 2.2 高价值场景数据挖掘体系建设: •搭建 “规则 + 大模型” 双驱动的数据挖掘产线:针对规则挖掘,设计接入多种传感器、定位、感知、底盘、车身信号并优化规则策略;针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等; •与算法团队协作迭代挖掘策略,提升 corner case 召回率(目标≥85%)。