百度多模态感知算法研发工程师(J93390)
任职要求
-计算机、电子、应用数学、自动化等相关专业的硕士及以上学历 -具有良好的机器学习的理论基础,良好的数学基础以及分析解决问题的能力 -熟练掌握C++、Python编程语言,具备Linux下开发能力,具有良好的编程习惯和工程实现能力 -熟悉主流点云、图像深度学习模型方法,在BEV、Occupa…
工作职责
-基于摄像头、激光雷达、4D毫米波雷达等多模态传感器设计与研发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力 -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制 -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用 -世界模型研发相关,设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力 -世界模型研发相关,构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决
-基于摄像头、激光雷达、4D毫米波雷达等多模态传感器设计与研发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力。 -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制 -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用 -世界模型研发相关,设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力 -世界模型研发相关,构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
1. 自动驾驶深度学习方向感知算法研发; 2. 研发3D目标检测,车道线/道路拓扑,红绿灯感知模型; 3. 研发视觉BEV感知以及多模态前融合算法; 4. 研发多任务模型优化,模型网络结构优化算法; 5. 跟进前沿算法,研发端到端自动驾驶感知预测one model模型,World Model等算法; 6. 感知多模态融合与多目标跟踪算法技术研发;
自动驾驶: 1、负责自动驾驶动态目标感知算法设计和优化,包括但不限于3D目标检测与跟踪、图像/点云语义分割、物体动静态估计、Radar融合以及相应的数据挖掘与仿真算法; 2、静态感知模块研发,包括但不限于各类静态障碍物检测跟踪、地图元素识别及其矢量化/语义化/拓扑化、可行驶区域/BEV分割/OccupancyNetwork及针对真实世界中OpenVocabulary的众包地图大模型研发; 3、感知基础算法研发,包括但不限于时序多模态等基础感知模块,大规模多模态预训练算法,室外大范围动静态场景重建与编辑技术,基于(可提示)交互式智能标注系统等。