百度自动标注算法工程师实习生(自动驾驶)(J93790)
该职位专注于自动驾驶场景下多模态大模型(VLA:Vision-Language-Action)的工程化落地,你将有机会在千万级数据上实车验证关于自动驾驶VLA的最新想法: 多模态模型工程化部署:结合视觉、语言与行为动作的联合建模机制,优化多模态模型的推理效率,支持自动驾驶系统的实时应用; 实车测试与性能验证:参与自动驾驶场景中的模型测试与性能评估,设计测试案例,分析模型在实际驾驶环境中的响应能力与行为决策效果; 数据采集与处理:负责多模态数据(视觉、语言、行为)的采集、标注与处理,构建高质量数据 pipeline,优化数据流的实时性与稳定性; 模型优化与轻量化:探索模型蒸馏、小样本泛化等技术,提升模型在自动驾驶复杂场景中的部署效率与资源利用率; 系统集成与技术支持:协助完成多模态模型与自动驾驶系统的集成测试,解决工程化落地过程中的技术问题; 技术文档与成果转化:撰写工程化技术文档,总结实车测试经验,参与技术报告、专利申请或产品转化工作。
该职位专注于自动驾驶场景下多模态大模型(VLA:Vision-Language-Action)的工程化落地,你将有机会在千万级数据上实车验证关于自动驾驶VLA的最新想法: 多模态模型工程化部署:结合视觉、语言与行为动作的联合建模机制,优化多模态模型的推理效率,支持自动驾驶系统的实时应用; 实车测试与性能验证:参与自动驾驶场景中的模型测试与性能评估,设计测试案例,分析模型在实际驾驶环境中的响应能力与行为决策效果; 数据采集与处理:负责多模态数据(视觉、语言、行为)的采集、标注与处理,构建高质量数据 pipeline,优化数据流的实时性与稳定性; 模型优化与轻量化:探索模型蒸馏、小样本泛化等技术,提升模型在自动驾驶复杂场景中的部署效率与资源利用率; 系统集成与技术支持:协助完成多模态模型与自动驾驶系统的集成测试,解决工程化落地过程中的技术问题; 技术文档与成果转化:撰写工程化技术文档,总结实车测试经验,参与技术报告、专利申请或产品转化工作。
自动驾驶: 1、负责自动驾驶动态目标感知算法设计和优化,包括但不限于3D目标检测与跟踪、图像/点云语义分割、物体动静态估计、Radar融合以及相应的数据挖掘与仿真算法; 2、静态感知模块研发,包括但不限于各类静态障碍物检测跟踪、地图元素识别及其矢量化/语义化/拓扑化、可行驶区域/BEV分割/OccupancyNetwork及针对真实世界中OpenVocabulary的众包地图大模型研发; 3、感知基础算法研发,包括但不限于时序多模态等基础感知模块,大规模多模态预训练算法,室外大范围动静态场景重建与编辑技术,基于(可提示)交互式智能标注系统等。