logo of baidu

百度自动驾驶-感知算法工程师(多模态障碍物检测方向)-2026AIDU-自动驾驶技术部(J86399)

校招全职AIDU项目地点:北京 | 上海状态:招聘

任职要求


-计算机、电子、应用数学、自动化等相关专业的硕士及以上学历;
-具有良好的机器学习的理论基础,良好的数学基础以及分析解决问题的能力;
-熟练掌握C++Python编程语言,具备Linux下开发能力,具有良好的编程习惯和工程实现能力;
-熟悉主要的点云、图像深度学习模型方法,包括且不局限于3D卷积/稀疏卷积/transformer等网络结构以及检测跟踪、分割等任务设计,同时在BEV、Occupancy等端到端表达建模方面有一定的实践经验;
-了解大语言模型或者视觉语言模型的工作原理、训练方法;
-了解常见的自监督、半监督方法及对应的数据方案;
-在计算机视觉或机器人相关领域顶级会议或期刊CVPRICCV、ICRA、IROS、PAMI等发表论文者优先;
-良好的沟通表达能力和团队合作意识。

工作职责


多模态传感器融合感知端到端模型研发:
-基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力;
-构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制;
-通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用;
-轻图/无图模型研发;
-基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力;
-构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。
世界模型研发:
-设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力;
-构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
包括英文材料
学历+
机器学习+
C+++
Python+
Linux+
编程规范+
深度学习+
Transformer+
OpenCV+
CVPR+
ICCV+
相关职位

logo of baidu
校招AIDU项目

多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。

更新于 2025-05-19
logo of cainiao
实习菜鸟集团2026

自动驾驶: 1、负责自动驾驶动态目标感知算法设计和优化,包括但不限于3D目标检测与跟踪、图像/点云语义分割、物体动静态估计、Radar融合以及相应的数据挖掘与仿真算法; 2、静态感知模块研发,包括但不限于各类静态障碍物检测跟踪、地图元素识别及其矢量化/语义化/拓扑化、可行驶区域/BEV分割/OccupancyNetwork及针对真实世界中OpenVocabulary的众包地图大模型研发; 3、感知基础算法研发,包括但不限于时序多模态等基础感知模块,大规模多模态预训练算法,室外大范围动静态场景重建与编辑技术,基于(可提示)交互式智能标注系统等。

更新于 2025-03-31
logo of sensetime
社招2年以上算法工程

1、研发基于VLM/多模态大模型的数据挖掘算法,精准识别自动驾驶长尾场景(如极端天气、复杂交通参与行为、罕见障碍物等); 2、构建高效的自动化数据挖掘Pipeline,提升数据标签质量并降低标注成本; 3、结合点云、图像、文本等多模态数据,设计多模态特征,支持数据的跨模态检索;

更新于 2025-08-20
logo of sensetime
社招2年以上算法工程

1、研发基于VLM/多模态大模型的数据挖掘算法,精准识别自动驾驶长尾场景(如极端天气、复杂交通参与行为、罕见障碍物等)。 2、构建高效的自动化数据挖掘Pipeline,提升数据标签质量并降低标注成本。 3、 结合点云、图像、文本等多模态数据,设计多模态特征,支持数据的跨模态检索

更新于 2025-03-20