logo of hello

哈啰智驾数据算法工程师(数据闭环)-【自动驾驶】

社招全职2年以上算法地点:上海状态:招聘

任职要求


1、本科及以上学历,计算机、软件工程、自动化、电子信息等理工科专业;
2、2 年及以上自动驾驶数据体系相关经验,有大厂 / 独角兽企业数据工厂搭建、量产项目经验者优先;
3、精通 PythonC++,熟悉 Linux 操作系统(常用指令、Shell 脚本),具备良好编程习惯(代码注释、Git 版本管理、CI/CD 流程);
4、掌握常见主流传感器数据处理:LiDAR(点云去噪 / 拼接 / 动静态补偿)、Camera(畸变校正 / 图像融合)等,精通 H264/H265/YUV/MJPEG 等编解码方式…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、数据闭环体系搭建与落地:负责自动驾驶全链路数据闭环体系设计与搭建,日均处理亿级传感器原始数据及标注数据,保障数据从采集、处理到模型训练的端到端流转,支撑感知、决策规划等端到端模型的高效训练;
2、数据闭环工具链研发:
2.1 云端数据处理 pipeline 开发:
•针对标注数据、场景数据,设计并落地数据清洗(去噪、去重、异常过滤)、解析、切片、抽帧、送标(对接标注平台)的全流程自动化 pipeline;
•优化 pipeline 吞吐量与延迟,目标支撑日均 10 万 + 场景数据处理,服务算法团队数据生产需求;
•推动工具链部署落地,解决线上运行故障(如数据阻塞、接口兼容问题),保障工具链可用性。
2.2 高价值场景数据挖掘体系建设:
•搭建 “规则 + 大模型” 双驱动的数据挖掘产线:针对规则挖掘,设计接入多种传感器、定位、感知、底盘、车身信号并优化规则策略;针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等;
•与算法团队协作迭代挖掘策略,提升 corner case 召回率(目标≥85%)。
包括英文材料
学历+
自动驾驶+
Python+
C+++
Linux+
Bash+
脚本+
编程规范+
还有更多 •••
相关职位

logo of xpeng
社招3年以上

1、负责自动驾驶端到端模型数据闭环研发工作,制定数据挖掘方案,数据标签自动化,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据场景和行为理解自动标注,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果; 5、综合车端的感知、规控等信息,利用大数据技术对各种corner case 进行识别和自动化归因算法开发; 6. 负责模型微调和强化学习数据分布和挖掘;

更新于 2025-06-25广州|上海
logo of hello
社招2年以上软研类

我们正在寻找一位对智能驾驶充满热情、对数据敏感的工程师。您将成为我们数据驱动研发体系的核心成员,负责构建和优化从车端数据采集到价值挖掘的完整链路。您的工作将直接提升智能驾驶系统的感知、决策和控制性能,是实现技术突破的关键一环。 核心职责: 1. 车端数据触发与采集: · 设计与开发基于特定场景(如Corner Case、接管、模型不确定性高)的智能数据触发策略; · 负责车端数据采集模块的开发与优化,确保数据的高效、可靠上传; · 定义和规范车端数据的格式、质量和合规性标准。 2. 数据回传与分析: · 参与构建和管理车云数据传输 pipeline,确保数据的完整性和时效性; · 对回传的海量数据进行初步分析、清洗和标注管理,为模型训练准备高质量数据集; · 利用数据分析工具,定位系统缺陷,挖掘影响智驾性能的关键场景。 3. 闭环工具链与平台支持: · 与数据平台和算法团队紧密合作,参与开发数据闭环相关的工具链和平台; · 优化数据检索、场景切片、仿真回灌等流程,提升算法迭代效率; · 负责车端软件OTA与数据闭环任务的联动,确保新模型能有效验证并部署。 4. 场景挖掘与仿真测试: · 基于真实路采数据,挖掘、构建和泛化高价值的测试场景库; · 将关键场景应用于仿真测试,快速验证算法修复和优化效果。

更新于 2025-11-04上海
logo of jd
社招1年以上数据开发岗

1.负责推进和参与自动驾驶用户数据闭环平台的构建和迭代优化,包括数据落盘回收、数据服务、数据工具等各环节的设计开发和上线落地 2.负责自动驾驶数据闭环相关的策略研发工作,制定数据挖掘方案,计划并实施,保证数据质量和闭环效果,为线上模型迭代提供数据支持。 3.探索车端数据挖掘/主动学习算法设计开发,提取高价值自动驾驶数据,解决长尾问题,包括但不局限于(rule base、SVM learning等) 4.基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题, 研究和设计自动驾驶各算法高效发现问题和利用数据的方案;与算法研发工程师合作,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代 5.综合车端的感知、规控、地图、车辆状态等信息,对各种异常case进行识别并做自动化归因策略开发;

更新于 2025-11-17北京
logo of horizon
校招算法序列

1、负责训练评测数据特征仓库建设、相关指标实现; 2、 负责训练评测数据交付,保证数据质量; 3、 负责端到端智驾数据产线基础工具链建设、训练评测数据业务流程建设;

更新于 2025-07-04北京|上海|香港