
哈啰智驾系统数据闭环工具链开发工程师
任职要求
1、3年以上软件开发经验,拥有计算机科学,电气工程或相关专业技术本科或以上学历; 2、熟练应用Python、c++等编程语言,具有丰富的多线程、并发编程实战经验; 3、熟悉常用数据结构及设计模式、能够独立完成模块的设计开发及性能调优; 4、具有Linux或QNX平台软件开发经验,熟悉内核基本原理、对内核核心模块如内存管理、进程调度及文件系统等开关代码有一定程度的研究经验者优先; 5、具有智能驾驶相关中间件使用检验优先(如Apolloos、ros等); 6、有智能驾驶行业数据工具链开发经验优先。
工作职责
1、负责自动驾驶大数据平台系统中的数据仓库建设,含数据处理,数据存储,数据工具等的开发和优化; 2、负责场景化数据挖掘、数据评估、模型训练系统的设计和开发; 3、负责车辆车端数据采集、数据回传相关软件开发工作; 4、负责数据体系相关数据的抽取、清洗、转换、服务、接口对接等工作; 5、负责所开发软件的性能优化相关工作以及相关开发文档的撰写。

1、数据闭环体系搭建与落地:负责自动驾驶全链路数据闭环体系设计与搭建,日均处理亿级传感器原始数据及标注数据,保障数据从采集、处理到模型训练的端到端流转,支撑感知、决策规划等端到端模型的高效训练; 2、数据闭环工具链研发: 2.1 云端数据处理 pipeline 开发: •针对标注数据、场景数据,设计并落地数据清洗(去噪、去重、异常过滤)、解析、切片、抽帧、送标(对接标注平台)的全流程自动化 pipeline; •优化 pipeline 吞吐量与延迟,目标支撑日均 10 万 + 场景数据处理,服务算法团队数据生产需求; •推动工具链部署落地,解决线上运行故障(如数据阻塞、接口兼容问题),保障工具链可用性。 2.2 高价值场景数据挖掘体系建设: •搭建 “规则 + 大模型” 双驱动的数据挖掘产线:针对规则挖掘,设计接入多种传感器、定位、感知、底盘、车身信号并优化规则策略;针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等; •与算法团队协作迭代挖掘策略,提升 corner case 召回率(目标≥85%)。

1、负责智驾数据闭环整体产品规划及方案设计,完成数据场景需求收集、数据存储、数据挖掘、数据标注、数据管理、模型训练、模型评测、仿真评测等工具链需求设计,支持智驾的快速迭代; 2、识别数据闭环涉及的法规要求,明确数据存储、传输、处理等环节的合规标准,制定合规策略,包括数据分类分级、加密要求、访问控制规则等; 3、负责智驾相关的竞品分析和市场调研,收集用户需求并分析痛点,剔除改进方案,提升产品力。
-负责汽车行业智能化解决方案的设计与编写,包括智驾数据平台、虚拟云仿真平台、数据合规以及智能座舱,将百度智驾工具链与座舱等产品和AI大模型结合,并基于客户实际业务场景进行方案落地设计; -调研市场同类产品,了解百度智驾工具链、座舱产品在市场中竞争优劣势; -配合GTM团队攻坚汽车KA客户,明确客户需求,与内部产品进行匹配,将客户需求真实传递至研发团队,支撑完成市场商业化工作; -定期进行汽车行业赋能,对GTM进行系统性培训,宣讲产研最新解决方案,回收关键商机并进行可靠性评估。