logo of baidu

百度自动驾驶-感知算法工程师(VLM语义方向)-2026AIDU-自动驾驶技术部(J86398)

校招全职AIDU项目地点:北京状态:招聘

任职要求


-计算机、电子、应用数学、自动化等相关专业的硕士及以上学历;
-具有良好的机器学习的理论基础,良好的数学基础以及分析解决问题的能力;
-熟练掌握C++Python编程语言,具备Linux下开发能力,具有良好的编程习惯和工程实现能力;
-熟悉主要的图像深度学习模型方法,包括且不局限…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


VLM模型方向:
-负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义;
-负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。
VLM数据闭环方向:
-负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作;
-使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。
包括英文材料
学历+
机器学习+
C+++
Python+
Linux+
编程规范+
还有更多 •••
相关职位

logo of baidu
校招AIDU项目

VLM模型方向: -负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义; -负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。 VLM数据闭环方向: -负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作; -使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。

更新于 2025-05-19北京|上海
logo of baidu
校招AIDU项目

多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。

更新于 2025-05-19北京|上海
logo of baidu
校招AIDU项目

多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。

更新于 2025-07-23北京|上海
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京