
哈啰智驾系统数据闭环工具链开发工程师
任职要求
1、3年以上软件开发经验,拥有计算机科学,电气工程或相关专业技术本科或以上学历; 2、熟练应用Python、c++等编程语言,具有丰富的多线程、并发编程实战经验; 3、熟悉常用数据结构及设计模式、能够独立完成模块的设计开发及性能调优; 4、具有Li…
工作职责
1、负责自动驾驶大数据平台系统中的数据仓库建设,含数据处理,数据存储,数据工具等的开发和优化; 2、负责场景化数据挖掘、数据评估、模型训练系统的设计和开发; 3、负责车辆车端数据采集、数据回传相关软件开发工作; 4、负责数据体系相关数据的抽取、清洗、转换、服务、接口对接等工作; 5、负责所开发软件的性能优化相关工作以及相关开发文档的撰写。

1、数据闭环体系搭建与落地:负责自动驾驶全链路数据闭环体系设计与搭建,日均处理亿级传感器原始数据及标注数据,保障数据从采集、处理到模型训练的端到端流转,支撑感知、决策规划等端到端模型的高效训练; 2、数据闭环工具链研发: 2.1 云端数据处理 pipeline 开发: •针对标注数据、场景数据,设计并落地数据清洗(去噪、去重、异常过滤)、解析、切片、抽帧、送标(对接标注平台)的全流程自动化 pipeline; •优化 pipeline 吞吐量与延迟,目标支撑日均 10 万 + 场景数据处理,服务算法团队数据生产需求; •推动工具链部署落地,解决线上运行故障(如数据阻塞、接口兼容问题),保障工具链可用性。 2.2 高价值场景数据挖掘体系建设: •搭建 “规则 + 大模型” 双驱动的数据挖掘产线:针对规则挖掘,设计接入多种传感器、定位、感知、底盘、车身信号并优化规则策略;针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等; •与算法团队协作迭代挖掘策略,提升 corner case 召回率(目标≥85%)。

我们正在寻找一位对智能驾驶充满热情、对数据敏感的工程师。您将成为我们数据驱动研发体系的核心成员,负责构建和优化从车端数据采集到价值挖掘的完整链路。您的工作将直接提升智能驾驶系统的感知、决策和控制性能,是实现技术突破的关键一环。 核心职责: 1. 车端数据触发与采集: · 设计与开发基于特定场景(如Corner Case、接管、模型不确定性高)的智能数据触发策略; · 负责车端数据采集模块的开发与优化,确保数据的高效、可靠上传; · 定义和规范车端数据的格式、质量和合规性标准。 2. 数据回传与分析: · 参与构建和管理车云数据传输 pipeline,确保数据的完整性和时效性; · 对回传的海量数据进行初步分析、清洗和标注管理,为模型训练准备高质量数据集; · 利用数据分析工具,定位系统缺陷,挖掘影响智驾性能的关键场景。 3. 闭环工具链与平台支持: · 与数据平台和算法团队紧密合作,参与开发数据闭环相关的工具链和平台; · 优化数据检索、场景切片、仿真回灌等流程,提升算法迭代效率; · 负责车端软件OTA与数据闭环任务的联动,确保新模型能有效验证并部署。 4. 场景挖掘与仿真测试: · 基于真实路采数据,挖掘、构建和泛化高价值的测试场景库; · 将关键场景应用于仿真测试,快速验证算法修复和优化效果。
-负责汽车行业智能化解决方案的设计与编写,包括智驾数据平台、虚拟云仿真平台、数据合规以及智能座舱,将百度智驾工具链与座舱等产品和AI大模型结合,并基于客户实际业务场景进行方案落地设计; -调研市场同类产品,了解百度智驾工具链、座舱产品在市场中竞争优劣势; -配合GTM团队攻坚汽车KA客户,明确客户需求,与内部产品进行匹配,将客户需求真实传递至研发团队,支撑完成市场商业化工作; -定期进行汽车行业赋能,对GTM进行系统性培训,宣讲产研最新解决方案,回收关键商机并进行可靠性评估。