百度自动驾驶-基础模型研发工程师-2026AIDU(J85291)
任职要求
1.学历背景: -计算机科学、电子信息、自动化、车辆工程等相关专业全日制博士学历(或特别优秀的硕士); -研究方向聚焦计算机视觉、深度学习、机器人等领域。 2.技术能力: -熟悉主流深度学习框架,精通模型训练、调优及部署全流程; -具备大模型(如Transformer、多模态融合模型等)研发经验,熟悉分布式训练、混合精度加速等技术; -扎实的编程功底,熟练掌握Python/C++,具备高性能代码优化与复杂系统开发能力。 3.加分项: -在CVPR/ICCV/ECCV/NeurIPS/ICML等顶会或顶级期刊发表过一作论文者优先; -有自动驾驶、机器人或AI大模型相关项目实践经验者优先; -熟悉大规模数据处理工具,有大规模分布式模型训练(千卡以上)经验者优先。 4.其他要求: -对自动驾驶技术有强烈热情,具备优秀的学习能力与技术敏锐度; -逻辑清晰,能独立承担技术攻坚任务,同时具备良好的团队协作与沟通能力。
工作职责
1.算法研发与创新: -负责自动驾驶领域基础模型的研发,包括但不限于多模态大模型训练、视觉底座模型构建、多任务学习框架设计、模型蒸馏与轻量化技术等; -探索自监督/半监督/弱监督学习方法,提升模型在复杂场景下的泛化能力与鲁棒性; -参与全球领先的自动驾驶技术研发,推动技术成果转化为高价值专利,并发表高水平学术论文。 2.系统优化与落地: -构建高效的大规模分布式训练框架,优化模型训练效率与资源利用率; -推动算法在车载计算平台或云端系统的工程化部署,解决实际业务场景中的性能瓶颈。 3.数据与模型迭代: -设计并实现大规模数据处理流水线,挖掘高价值数据驱动模型性能提升; -构建场景化评测基准,持续驱动模型在复杂城市路况中的性能迭代。 4.跨团队协作: -与感知、规划、仿真等团队深度合作,推动基础模型在自动驾驶全链路中的技术落地。
多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
VLM模型方向: -负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义; -负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。 VLM数据闭环方向: -负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作; -使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。
1.算法研发与创新: -负责自动驾驶领域基础模型的研发,包括但不限于多模态大模型训练、视觉底座模型构建、多任务学习框架设计、模型蒸馏与轻量化技术等; -探索自监督/半监督/弱监督学习方法,提升模型在复杂场景下的泛化能力与鲁棒性; -参与全球领先的自动驾驶技术研发,推动技术成果转化为高价值专利,并发表高水平学术论文。 2.系统优化与落地: -构建高效的大规模分布式训练框架,优化模型训练效率与资源利用率; -推动算法在车载计算平台或云端系统的工程化部署,解决实际业务场景中的性能瓶颈。 3.数据与模型迭代: -设计并实现大规模数据处理流水线,挖掘高价值数据驱动模型性能提升; -构建场景化评测基准,持续驱动模型在复杂城市路况中的性能迭代。 4.跨团队协作: -与感知、规划、仿真等团队深度合作,推动基础模型在自动驾驶全链路中的技术落地。
多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。