小米自动驾驶数据算法工程师
任职要求
1、本科及以上学历,计算机、机器学习、人工智能等相关专业优先 2、熟练使用C++/Python,扎实的数据结构与算法能力,熟悉深度学习框架(PyTorch/TensorFlow)及模型部署流程 3、能理解算法对于数据的诉求,有自动驾驶数据闭环开发经验者优先 4、能利用算法模型尤其是大模型提升数据闭环效率 5、了解智能驾驶技术及行业趋势,具备快速学习前沿知识的能力
工作职责
1、负责设计实现自动驾驶的数据闭环系统,包括数据挖掘、真值标注产线、仿真评测等,以利用海量数据持续提升自动驾驶模型能力 2、负责端云协同相关服务,包含搭建服务链路、模型部署推理优化等,提升自动驾驶产品能力 3、实现数据闭环的全自动化处理,优化数据和工程平台质量,提升整个数据闭环链路的运行效率 4、与算法团队、架构团队密切合作,沉淀通用的数据驱动能力,建设相关的平台工具,提升整体工作效率
自动驾驶数据算法工程师 : 1、数据处理与分析:负责自动驾驶标注数据的筛选、清洗和训练预处理,确保数据的准确性和完整性。 2、数据算法开发:运用深度学习算法和SLAM方法,提升数据三维重建质量和多传感器联合标定精度。 3、系统开发与维护:参与自动驾驶数据处理系统的设计和开发,确保系统的稳定性和高效性。
1、负责自动驾驶端到端模型数据闭环研发工作,制定数据挖掘方案,数据标签自动化,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据场景和行为理解自动标注,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果; 5、综合车端的感知、规控等信息,利用大数据技术对各种corner case 进行识别和自动化归因算法开发; 6. 负责模型微调和强化学习数据分布和挖掘;

1、数据闭环体系搭建与落地:负责自动驾驶全链路数据闭环体系设计与搭建,日均处理亿级传感器原始数据及标注数据,保障数据从采集、处理到模型训练的端到端流转,支撑感知、决策规划等端到端模型的高效训练; 2、数据闭环工具链研发: 2.1 云端数据处理 pipeline 开发: •针对标注数据、场景数据,设计并落地数据清洗(去噪、去重、异常过滤)、解析、切片、抽帧、送标(对接标注平台)的全流程自动化 pipeline; •优化 pipeline 吞吐量与延迟,目标支撑日均 10 万 + 场景数据处理,服务算法团队数据生产需求; •推动工具链部署落地,解决线上运行故障(如数据阻塞、接口兼容问题),保障工具链可用性。 2.2 高价值场景数据挖掘体系建设: •搭建 “规则 + 大模型” 双驱动的数据挖掘产线:针对规则挖掘,设计接入多种传感器、定位、感知、底盘、车身信号并优化规则策略;针对大模型挖掘任务,完成数据方案制定、模型微调、loss优化、模型评测等; •与算法团队协作迭代挖掘策略,提升 corner case 召回率(目标≥85%)。