美团重建/仿真算法专家
任职要求
1. 计算机视觉、图形学、人工智能等相关专业的硕士生/博士生,具备良好的英文写作能力; 2. 熟悉三维重建 SFM/MVS/SLAM/COLMAP/Glomap等传统三维重建算法,并有落地经验或者相关论文; 3. 熟悉DUSt3R、MASt3R、VGGT等端到端学习算法,并有相关落地经验或…
工作职责
1. 负责研发空间智能核心技术,进行室内/室外/航拍/卫星影像等全场景高质量空间理解、重建与生成,静态与动态场景的仿真,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2. 参与并实现端到端多视角三维重建流水线:数据预处理、相机/传感器标定与对齐、稠密重建与渲染模块的设计与开发。 3. 优化算法性能(计算与内存),并参与模型推理加速、量化或裁剪等工程化工作以满足实时/大规模训练需求。

1、围绕基于领先的世界模型技术,进行自动驾驶图像生成以及场景生成的性能提升相关算法以及落地应用;相关技术包括:3DGS、Diffusion Model、多模态、视频生成大模型等; 2、以世界模型为底层技术,构建高真实性、高效率的闭环仿真能力,探索闭环仿真能力与端到端自动驾驶算法紧密结合的技术方案; 3、建立端到端自动驾驶评价指标及仿真测试能力; 4、负责自动驾驶直接模型的算法开发工作,包括但不限于场景生成、三维重建等。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。

高精地图和定位团队介绍 如果将无人车和人脑类比,高精地图和定位系统大致对应于后者中掌管空间记忆、感知和定位的部分。它的使命是为无人车提供翔实准确的道路3D几何和语义信息,让无人车对行驶环境了如指掌,从而在其中行动自如,我们同时还负责提供高速、精准的3D定位,让车辆每时每刻都知晓当前的精确位置。高精地图和定位在无人车技术栈中占据着非常重要的位置,感知、规划、控制、仿真等各大模块都要依赖它提供的道路环境以及车辆位置的信息对周围世界进行理解,做出正确的决策。文远知行的高精地图和定位团队和公司一起成长,完全自主构建了大规模高精地图,覆盖中美多个城市超过3000公里道路,提供精确达厘米级的3D结构数据以及车道线、交通信号等大量语义信息。自行研发的定位技术,基于激光雷达、相机、卫星及惯性导航等多传感器融合,能提供实时的厘米级定位,成功实现了在暴雨中自动驾驶穿越1.5公里长隧道。 在人工智能的应用中,高精地图和定位是比较独特的。我们知道,计算机视觉作为人工智能的重要分支,其核心问题分为语义理解和几何理解两大类,前者以解析图像中物体或场景的语义信息为目的,后者的目标则是重构3D场景以及对物体进行3D定位。在高精地图和定位系统中,恰恰这两大类技术都有着非常关键的应用。除此之外,我们还是高精度卫星、惯性导航等硬件的重度用户,多模态信号处理和融合更是我们的核心技术之一。因此,这是一个多学科高度综合的应用,无论你精通深度学习等机器学习技术,还是专攻3D重建、SLAM,又或是信号处理、多传感器融合高手,这里都有你一展身手的广阔空间。同时,我们致力搭建大规模、高可用的高精度地图系统,大数据和全栈开发的编程精英同样能找到用武之地。 1. 基于深度学习打造不依赖高精度地图的定位和实时地图系统,包括模型设计、训练、部署,车上系统反馈和形成数据闭环 2. 设计和构建深度神经网络模型,用于对传感器数据进行特征提取、数据融合和位置估计 3. 处理和分析大规模的自动驾驶系统相关的Camera、Lidar、GPS和IMU等各种传感器数据,利用深度学习技术进行特征提取、数据建模和预测分析 4. 进行深度学习模型的调优和调参,以提高模型的性能、效率和鲁棒性
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。