小米端到端算法(感知方向)专家工程师

1、围绕基于领先的世界模型技术,进行自动驾驶图像生成以及场景生成的性能提升相关算法以及落地应用;相关技术包括:3DGS、Diffusion Model、多模态、视频生成大模型等; 2、以世界模型为底层技术,构建高真实性、高效率的闭环仿真能力,探索闭环仿真能力与端到端自动驾驶算法紧密结合的技术方案; 3、建立端到端自动驾驶评价指标及仿真测试能力; 4、负责自动驾驶直接模型的算法开发工作,包括但不限于场景生成、三维重建等。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型及端到端模型在车端导航及定位应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、BEV环境感知、多模态融合、强化学习等领域具备丰富且有独创性的研究经历; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等; 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等; 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和复杂场景泛化能力; 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

工作职责【负责其中之一的方向即可】 1、【道路几何方向】跟进学界最新主流道路集合感知进展,包括且不限于车道线,停止线,斑马线,Roadmarker, 道路拓扑等方向 2、【Occupancy方向】跟进学界最新主流占据网络感知层面进展,研究基于相机、激光雷达、毫米波雷达等Occupancy感知方案,业界内形成技术领先; 3、【BEV方向】跟进学界主流BEV感知进展,研究基于相机、激光雷达、毫米波雷达等端到端BEV感知方案,业界内形成技术领先; 4、【激光雷达方向】跟进学界主流激光雷达感知进展,研究基于激光雷达的动态&静态障碍物感知技术,业界内形成技术领先;