
地平线智能驾驶数据平台开发工程师
任职要求
计算机相关专业本科及以上学历,3年以上后端或数据平台开发经验 精通Python/Golang/C++开发,有大型分布式系统实战经验 熟悉以下技术领域至少两个方向: 大数据处理:Spark/Flink/Kafka等组件的开发与调优 分布式存储:HDFS/HBase/对象存储等系统应用 微服务架构:高并发服务设计、容器化部署及运维 数据仓库:ETL开发、维度建…
工作职责
负责自动驾驶数据平台全链路开发,包括数据采集、存储计算、服务接口及后台系统建设 设计和开发高可用分布式数据服务,处理PB级自动驾驶数据,优化数据读写与计算性能 构建数据平台核心后台系统,开发任务调度、API服务、权限管理等基础模块 实现实时/离线数据处理管道,保障多源异构数据的高效流转与可靠存储 开发数据治理相关系统,包括数据质量监控、元数据管理、异常告警等功能 持续优化平台稳定性,设计容灾方案与自动化运维体系

1、负责自动驾驶大数据平台系统中的数据仓库建设,含数据处理,数据存储,数据工具等的开发和优化; 2、负责场景化数据挖掘、数据评估、模型训练系统的设计和开发; 3、负责车辆车端数据采集、数据回传相关软件开发工作; 4、负责数据体系相关数据的抽取、清洗、转换、服务、接口对接等工作; 5、负责所开发软件的性能优化相关工作以及相关开发文档的撰写。
1. 负责智能辅助驾驶场景数据平台开发,包括但不限于数据打标,数据挖掘,数据自动/辅助标注,模型训练工程化。 2. 负责数据闭环业务流串联开发,推进算法模块,各个子系统的生产流程自动化,提高迭代效率。

1. 数据采集系统牵头设计与实施 (核心): - 牵头自动驾驶数据采集系统的整体架构设计、技术选型与方案制定,涵盖传感器(摄像头、激光雷达、毫米波雷达、GNSS/IMU、CAN总线等)数据同步、采集、压缩、加密、上传等全链路。 - 制定并维护数据采集规范与策略,包括触发条件(场景触发、问题触发、定时触发)、采集频率、数据格式、存储周期、优先级等。 - 牵头解决数据采集过程中的技术难题和性能瓶颈(如带宽限制、存储空间、同步精度、丢帧问题)。 2. 数据管理体系构建与运维 (核心): - 牵头设计、搭建和维护大规模、多模态自动驾驶数据存储与管理平台(如基于对象存储、分布式文件系统、数据库等)。 - 建立并主导执行数据的全生命周期管理策略,包括数据接入、清洗、标注(与标注团队协作)、存储、版本控制、归档、销毁等流程。 3. 跨团队协作与需求对接: - 作为数据平台的核心接口人,主动对接感知、规划控制、仿真、测试、地图等下游团队的数据需求,理解其业务场景(如特定Corner Case收集、模型训练数据需求、问题复现数据需求),并将其转化为数据采集和管理方案。 4. 工具链开发与流程规范: - 主导或参与开发内部数据管理工具和平台功能,提升数据操作效率(如数据检索、样本提取、质量检查工具)。 - 建立、维护和推广数据采集、存储、治理、使用的流程规范、操作手册和标准。

1.深入理解自动驾驶感知/预测/环境融合/规控算法,深度嵌入研发团队 2.负责智能驾驶产品各模块算法测评体系内自动化测试框架的设计和开发工作, 与研发协作并指导团队完成测评体系搭建工作, 并不断完善和优化测评框架, 满足产品算法测评验证的需求; 3.负责智能驾驶数据闭环平台的测试开发和CI/CD流程搭建工作, 并开发测试流程,测试报告展示等工具; 4.负责内部测试工具规划、设计和开发,并持续进行工具优化, 帮助团队提高测试效率; 5.负责CI/CD测试流程搭建,完善代码管理,版本管理和配置管理; 6.协助完成版本算法评测工作并输出测试结论, 推动产品算法性能提升; 7.带领和指导团队成员完成感知算法测评的方案设计和框架开发工作, 包含GT生产, 自动化测评开发;