
文远知行视觉4D标注方向算法工程师(2026届校招)
任职要求
1.熟练掌握Python,熟悉Pytorch、transformers等常用工具,具备常用数据结构及算法的扎实基础; 2.扎实的Python/C++开发能力,具备良好的编程习惯。 满足以下条件之一: 1.精通多视几何、计算机视觉、机器人等基础知识,具有VIO/SLAM/SFM/3D视觉等算法开发和系统实现经验; 2.熟练使用OpenCV、Eigen、G2O、Ceres、Colmap等库; 3.熟悉深度学习在位姿、重建、地图等方面的算法和应用,熟悉Nerf、Gaussian Splatting等算法和应用; 4.了解前沿4d labeling方法。 工作地点:上海漕河泾开发区 加分项:具有自动驾驶研发经验;在顶级会议上发表过文章。
工作职责
关于我们人工智能模型的表现很大程度上依赖于高质量的训练数据。文远知行的数据团队拥有专业的数据标注团队和系统,我们的算法团队致力于通过先进的模型和算法通过自动和半自动标注提高标注效率和质量。 构建自动驾驶4d labeling系统和算法,开发多传感器或纯视觉的动静态对象自动标注算法。
多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
多模态传感器融合感知端到端模型研发: -基于摄像头、激光雷达、3D/4D毫米波雷达等多模态传感器设计与开发融合感知模型与算法(包含但不限于:障碍物检测、OCC(Occupancy Network)、场景语义分割、跟踪等任务),提升在复杂场景、极端场景下的感知能力; -构建覆盖Corner Case的自动化数据采集与标注系统,开发数据质量评估体系,建立数据-模型迭代闭环机制; -通过自监督、弱监督学习提升模型泛化能力,加速数据飞轮,探索VLM、VLA等技术在数据飞轮中的实践与应用; -轻图/无图模型研发; -基于多模态传感器设计与实现轻图、无图模型,实现L4下的轻图实时生成,包含拓补信息、各种道路属性等的实时生成,为L4大规模应用提供基础道路感知能力; -构建轻图对应的数据闭环与数据飞轮,如挖掘算法、难例模拟生成方式、轻图适用的仿真系统等设计与实现。 世界模型研发: -设计基于多模态传感器的世界模型,为复杂问题解决效果验证、端到端模型验证提供强有力的仿真验证能力与感知能力; -构建为实现世界模型需要的数据闭环与数据飞轮,如数据采集、生成、自动化标注等相关强算法问题解决。
-负责计算机视觉或深度学习算法相关的前沿技术研究与落地工作 -负责图像、点云相关SLAM/深度学习算法在城市规模建图算法研究与落地工作 -负责图像、点云相关算法在轻量化制图与众包更新方面的研究与落地工作 -协同探索大模型、基础模型等在建图定位等方向的研究与应用

1、自动化标注大模型研发:面向自动驾驶感知与规控任务(如障碍物、车道线、红绿灯、OCC等),设计与训练自动化/半自动化标注大模型,实现基于点云或图像的检测、跟踪、分割、融合等核心能力。 2、多模态融合与模型优化:基于相机、LiDAR、GNSS、IMU、轮速计等多源数据,构建多模态特征融合与生成模型,持续提升 4D 感知场景下的检出率、精度与鲁棒性。 3、自动化标注的Dag流程设计:负责将自动化标注链路拆解为可复用算子节点(operator),明确各节点输入输出、功能与依赖关系,保障器高效稳定执行; 4、数据闭环与持续学习:与数据挖掘、质量评估、模型训练、验证环节紧密协同,构建模型驱动的数据闭环体系,不断提升自动标注效率、准确率与泛化能力。 5、技术探索与落地:关注 AIGC、生成式标注、主动学习、弱监督、LLM+视觉理解等前沿方向,并推动其在自动标注任务中的应用落地