百度自动驾驶-感知算法工程师(多模态障碍物检测方向)-2026AIDU-自动驾驶技术部(J86399)
任职要求
-计算机、电子、应用数学、自动化等相关专业的硕士及以上学历; -具有良好的机器学习的理论基础,良好的数学基础以及分析解决问题的能力; -熟练掌握C++、Python编程语言,具备Linux下开发能力,具有良好的编程习惯和工程实现能力; -熟悉主要的点云、图像深度学习模型方法,包括且不局限于3D卷积/稀疏卷积/transformer等网络结构以及检测跟踪、分割等任务设计,同时在BEV、Occupancy等端到端表达建模方面有一定的实践经验; -了解大语言模型或者视觉语言模型的工作原理、训练方法; -了解常见的自监督、半监督方法及对应的数据方案; -在计算机视觉或机器人相关领域顶级会议或期刊CVPR、ICCV、ICRA、IROS、PAMI等发表论文者优先; -良好的沟通表达能力和团队合作意识。
工作职责
多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
自动驾驶: 1、负责自动驾驶动态目标感知算法设计和优化,包括但不限于3D目标检测与跟踪、图像/点云语义分割、物体动静态估计、Radar融合以及相应的数据挖掘与仿真算法; 2、静态感知模块研发,包括但不限于各类静态障碍物检测跟踪、地图元素识别及其矢量化/语义化/拓扑化、可行驶区域/BEV分割/OccupancyNetwork及针对真实世界中OpenVocabulary的众包地图大模型研发; 3、感知基础算法研发,包括但不限于时序多模态等基础感知模块,大规模多模态预训练算法,室外大范围动静态场景重建与编辑技术,基于(可提示)交互式智能标注系统等。

1、研发基于VLM/多模态大模型的数据挖掘算法,精准识别自动驾驶长尾场景(如极端天气、复杂交通参与行为、罕见障碍物等); 2、构建高效的自动化数据挖掘Pipeline,提升数据标签质量并降低标注成本; 3、结合点云、图像、文本等多模态数据,设计多模态特征,支持数据的跨模态检索;