百度实习自动驾驶感知3D算法工程师(J71300)
任职要求
-2025届应届毕业生,计算机、电子、应用数学等相关专业的硕士或以上学历 -具有良好的机器学习的理论基础,良好的数学基础以及分析解决问题的能力 -了解传感器基本工作原理,具有良好的点云几何处理与深度学习理论基础,在点云检测、分割、识别去噪、配准、场景建模与语义理解等方面有相关实践经验 -熟悉Python、C/C ++程序开发,具有良好的编程习惯 -具有实时自动驾驶/机器人系统开发搭建与性能优化经验 -在计算机视觉或机器人相关领域顶级会议或期刊CVPR、ICCV、ICRA、IROS、PAMI等发表论文者优先 -具有良好的英文读写能力 -具有良好的沟通能力,良好的团队合作精神,良好的科研精神
工作职责
-负责激光雷达点云的目标检测、识别、跟踪算法研发 -负责激光雷达点云的场景语义理解、建模等相关算法研发 -负责camera、lidar、radar等多传感器融合算法研发 -负责障碍物场景语义、行为意图算法研发
自动驾驶: 1、负责自动驾驶动态目标感知算法设计和优化,包括但不限于3D目标检测与跟踪、图像/点云语义分割、物体动静态估计、Radar融合以及相应的数据挖掘与仿真算法; 2、静态感知模块研发,包括但不限于各类静态障碍物检测跟踪、地图元素识别及其矢量化/语义化/拓扑化、可行驶区域/BEV分割/OccupancyNetwork及针对真实世界中OpenVocabulary的众包地图大模型研发; 3、感知基础算法研发,包括但不限于时序多模态等基础感知模块,大规模多模态预训练算法,室外大范围动静态场景重建与编辑技术,基于(可提示)交互式智能标注系统等。
1. 负责感知算法实现与落地; 2. 负责学术论文调研,提取可落地方案; 3. 针对极端场景,实验解决方法。 【课题名称】 E2E超级认知型感知 【课题内容】 1. 探索3D-2D感知细粒度提升,语义/几何感知拆解,构建感知不确定性模型,提升感知泛化能力; 2. 探索从感知到认知的跃升,理解场景内障碍物对驾驶决策的影响,理解场景内Agent行为逻辑,构建新一代通用感知描述模型。
1、自动驾驶多模态算法研究与应用:负责自动驾驶领域的多模态大模型技术研究及算法开发,包括视觉语言模型(VLM)、一段式端到端模型,以及多模态大模型在复杂场景下的技术整合。 2、多模态感知基础模型研究:开展文本(Text)、视觉(Vision)与点云(Point)融合的多模态感知基础模型研究,包括但不限于4D表征、推理(Reasoning)感知、规划等研究方向。 3、视觉-语言-动作(VLA)大模型研究:负责基于视觉-语言-动作(VLA)架构的端到端方案研究,包括数据生产方案、VLA模型架构、效率优化等方向设计与研发。 4、预训练模型研发:研究基于未来帧预测的预训练模型,结合端到端框架设计,探索其在自动驾驶感知、决策与控制闭环中的可行性及性能提升方向。