京东自动驾驶数据闭环开发工程师
任职要求
1、计算机视觉、模式识别、机器学习、电子信息、机器人、大数据等相关专业的本科/硕士,需要有自动驾驶或大数据处理 1 年以上从业经验; 2、熟悉数据结构、算法、代码优化和大规模数据处理等相关知识;精通 C/C++ 或 Python 编程,具备 Flink、Spark、Hadoop 等大数据处理框架的实际开发经验; 3、熟悉数据湖技术(如 Hadoop、HDFS、Delta Lake、Iceberg 等),能够设计并优化大规模数据存储和处理方案; 4、了解智驾技术体系、软硬件架构、功能 pipeline,对自动驾驶设计的传感器数据、算法中间结果有一定的了解; 5、有自动驾驶自动标注、车云数据挖掘 Trigger 及自动化根因分析经验,能够利用大数据技术(如 Flink、Spark)实现高效的数据处理和分析; 6、对数据敏感,善于灵活应用各种算法(包括机器学习、深度学习、大数据处理技术)解决业务问题; 7、具备至少一个方向的深度学习模型研发和应用经验,如目标检测、目标分割、主动学习等; 8、熟悉分布式计算和数据流处理技术,能够基于 Flink 或 Spark 实现实时和离线数据处理任务。 符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。
工作职责
1、负责自动驾驶数据闭环相关的平台研发工作,制定数据挖掘方案,计划并实施,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据闭环的标定平台、模型部署平台研发工作,通过数据及算法挖掘传感器标定异常,提前发现问题以及风险前置; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案。与算法研发工程师合作,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果。设计和开发挖掘策略/算法/工具,为感知算法任务提供研发迭代需要的数据,支持数据转化为驾驶能力; 5、综合车端的感知、规控、地图、车辆状态等信息,利用大数据技术(如 Flink、Spark)对各种异常 case 进行识别和自动化归因算法开发; 6.负责推进自动驾驶用户数据闭环平台构建、优化,确保闭环科学地、稳定地、高效地运转。基于数据湖技术(如 Hadoop、HDFS、Delta Lake 等)构建高效的数据存储、处理和分析平台。
-负责优化设计自动驾驶数据流水线,构建高可用、易扩展、低延迟的服务架构 -负责自动驾驶模型迭代相关的数据仓库、数据处理等方向的技术规划与开发工作 -负责设计开发用户端SDK、API支持自动驾驶数据高效、稳定、高并发低时延地读写 -负责设计及实现合理的数据生命周期管理策略,保证满足业务数据需求和存储成本控制需求
负责提升自动驾驶算法评测能力,结合算法的设计和迭代流程,建设高效准确的评测分析系统和工具,并输出评价指标或报告,帮助实现高效有效的算法数据闭环。具体职责包括设计实现评估指标、建设完善基于采集+生成的评测集构建,自动化的评估闭环系统等。
1、负责设计实现自动驾驶的数据闭环系统,包括数据挖掘、真值标注产线、仿真评测等,以利用海量数据持续提升自动驾驶模型能力 2、负责端云协同相关服务,包含搭建服务链路、模型部署推理优化等,提升自动驾驶产品能力 3、实现数据闭环的全自动化处理,优化数据和工程平台质量,提升整个数据闭环链路的运行效率 4、与算法团队、架构团队密切合作,沉淀通用的数据驱动能力,建设相关的平台工具,提升整体工作效率

1、核心引擎开发:使用 C++ 开发高性能、低延迟的实时数据筛选引擎; 2、ROS2 集成:基于 ROS2 框架,开发节点 (Node) 以订阅(Subscribe)来自不同传感器和自动驾驶模块的 Topic 数据流; 3、筛选规则设计:设计并实现灵活、可配置的筛选器规则系统,能够基于多源数据(如目标检测结果、车道线信息、车辆状态等)进行复杂逻辑判断; 4、低代码脚本桥接:负责 C++ 引擎与低代码脚本的无缝桥接,使算法工程师或数据科学家能够通过编写脚本来定义和动态加载筛选触发逻辑,实现 “代码即规则” 的灵活模式; 5、触发与录制:实现筛选器的触发机制,当满足预设规则时,精确触发并控制数据录制模块,只保存有价值的关键数据片段; 6、系统优化:持续优化系统性能,包括 CPU 占用率、内存使用和数据处理延迟,确保在嵌入式环境下稳定可靠运行; 7、调试与测试:进行单元测试、集成测试和现场调试,解决开发和部署过程中的技术问题; 8、文档编写:编写清晰、规范的技术设计文档、API 文档和用户手册。