小米端到端数据闭环研发工程师
1. 负责自动驾驶大规模数据挖掘及数据合成平台的设计与研发,高效支撑算法数据需求; 2. 负责自动驾驶大规模数据管线的设计与研发,保障数据加工产线高效率、低成本运转; 3. 负责自动驾驶算法评测平台的设计与研发,驱动算法高效迭代,保障算法发版质量。
1、负责自动驾驶端到端模型数据闭环研发工作,制定数据挖掘方案,数据标签自动化,保证数据质量和闭环效果,为线上模型迭代提供数据支持; 2、负责数据场景和行为理解自动标注,通过数据驱动的方式挖掘自动驾驶算法需要关注的关键场景和高价值数据,参与算法迭代; 3、基于海量自动驾驶场景和行为,科学地管理自动驾驶用户数据和已挖掘的算法问题,研究和设计自动驾驶各算法高效发现问题和利用数据的方案; 4、负责自动驾驶数据闭环相关的策略研发工作,制定项目挖掘方案,计划并实施,保证数据质量和闭环效果; 5、综合车端的感知、规控等信息,利用大数据技术对各种corner case 进行识别和自动化归因算法开发; 6. 负责模型微调和强化学习数据分布和挖掘;

1. 负责公司数据闭环体系搭建,处理亿级数据量,为端到端模型训练提供数据产线支持; 2. 主导数据闭环工具链研发,加速自动驾驶模型迭代,职责涉及以下方向: 2.1 数据筛选器:开发车端热更新筛选器和影子模式,设计并实现触发逻辑,打通云端配置到车端链路; 2.2 数据录制及上云:车端数据录制,包括原始数据封装、压缩、加偏、脱敏、加密等,打通车云上传链路; 2.3 云端数据处理:对于标注数据、场景数据,开发数据清洗、编解码、自动打标、高价值数据挖掘、数据检索、评测等自动化工具,适配自动驾驶模型数据pipeline. 3. 基于云资源和图商合规云体系的数据闭环:基于云上资源构建标注、训练平台,并完成智驾算法的适配对接和数据pipeline开发。