logo of didi

滴滴自动驾驶-数据闭环工程师(J250626019)

社招全职技术地点:北京状态:招聘

任职要求


1)计算机科学,电子工程,自动化工程,软件工程等相关专业的本科或硕士学位获得者;
2)熟悉Linux开发环境,良好的系统编程、数据结构算法基础、系统设计能力;
3)熟练掌握PythonC++,有丰富的系统设计和开发经验者优先
4)熟悉常用数据库MysqlMongoDBElasticsearch和分布式存储(HDFS/S3);
5)掌握分布式系统设计,熟悉微服务与容器化(Docker/K8s),对常用的组件如MQRPC等有实践经验;

加分项
1)有自动驾驶/机器人标注平台开发经验等平台架构
2)参与过AI模型训练数据生产项目(数据集构建、数据生成)

工作职责


1)设计并实现高并发、高可用的数据标注平台后端架构,支持图像、点云、视频等多模态自动驾驶数据的标注需求;
2)搭建标注数据存储与治理系统,保障大规模标注数据(PB级)的安全存储与高效检索;
3)搭建面向自动驾驶大模型的数据生产系统,涵盖数据清洗、增强、合成与标注全流程;
4)构建数据版本管理与回溯系统,实现数据集迭代过程的可追踪性,满足模型训练合规要求;
包括英文材料
学历+
Linux+
数据结构+
算法+
系统设计+
Python+
C+++
MySQL+
MongoDB+
ElasticSearch+
HDFS+
分布式系统+
微服务+
Docker+
Kubernetes+
消息队列+
RPC+
自动驾驶+
S3+
相关职位

logo of momenta
社招3年以上数据挖掘

1、负责自动驾驶数据闭环核心系统的设计与开发,构建从车端数据采集到云端模型迭代的全链路自动化体系 2、优化车端影子模式(Shadow Mode)系统,设计高效的触发式数据采集策略,精准捕获有价值的 Hard Event 数据 3、开发智能数据筛选器(Filter),通过规则引擎与 AI 模型相结合的方式,从海量路测数据中高效筛选高价值训练样本 4、搭建云端自动化数据挖掘平台,实现异常场景、算法失效案例的自动发现与聚类分析 5、推动自动标注系统的迭代优化,自动化评估驾驶行为质量,自动化清洗坏行为数据,提升标注效率与质量 6、与EBM团队深度协作,将数据闭环产出转化为模型性能的持续提升 7、构建数据质量评估体系,确保训练数据的准确性、多样性与代表性

更新于 2025-09-19
logo of jd
社招1年以上数据开发岗

1、负责自动驾驶数据闭环相关的平台研发工作,制定数据挖掘方案,计划并实施,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据闭环的标定平台、模型部署平台研发工作,通过数据及算法挖掘传感器标定异常,提前发现问题以及风险前置; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案。与算法研发工程师合作,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果。设计和开发挖掘策略/算法/工具,为感知算法任务提供研发迭代需要的数据,支持数据转化为驾驶能力; 5、综合车端的感知、规控、地图、车辆状态等信息,利用大数据技术(如 Flink、Spark)对各种异常 case 进行识别和自动化归因算法开发; 6.负责推进自动驾驶用户数据闭环平台构建、优化,确保闭环科学地、稳定地、高效地运转。基于数据湖技术(如 Hadoop、HDFS、Delta Lake 等)构建高效的数据存储、处理和分析平台。

更新于 2025-06-09
logo of mi
社招5年以上A94770

1. 基于小米自动驾驶数据云平台,建设数据闭环链路,包括但不限于数据挖掘、数据标注、数据集管理、训练平台、评测平台和数据分析等功能,以支持自动驾驶模型的迭代优化; 2. 实现数据闭环的全自动化处理,优化数据和工程平台质量,提升整个数据闭环链路的运行效率; 3. 与算法团队、架构团队密切合作,沉淀通用的数据驱动能力,建设相关的平台工具,提升整体工作效率; 4. 调研行业先进的数据驱动方法,借鉴其中的先进理念和经验,并应用到数据闭环链路建设中,推动技术创新。

更新于 2024-10-31
logo of mi
社招A113161A

1. 负责自动驾驶大规模数据挖掘算法及平台的设计与研发,高效支撑算法数据需求 2. 负责自动驾驶数据集存储系统与管理平台的设计与研发,保障数据集高效发版

更新于 2025-05-08