
地平线SLAM/3D算法实习生(定位/建图/位姿估计方向)
任职要求
1.硕士或以上学历,计算机/人工智能相关专业,具备良好的英文文献检索和阅读能力; 2.具有扎实的数学基础,精通多视几何、计算机视觉、机器人等基础知识; 3.具有VSLAM/VIO/SLAM/SFM/3D视觉等算法开发和系统实现经验; 4.扎实的C/C++编程知识及熟练使用OpenCV/Eigen/G2O/Ce…
工作职责
在相关领域专家指导下,研究高精度视觉 SLAM/SFM 位姿估计算法;

我们希望你是 2024年11月-2026年10月 期间毕业的 博士/硕士研究生 同时也是: 学术先锋:在国内外顶刊/顶会上发表过重要学术论文(包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊) 竞赛达人:在国内外顶尖赛事中取得优秀成绩(包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup、Kaggle、Nips、Kdd) 实战高手:有自动驾驶、机器人、大模型基座,复杂Agent相关科研项目或实习经历(包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等) 同频共振:理性务实、敢想敢干、渴望成功、乐观激进、聪明自省 工作内容 1.面向L4业务的行泊车场景,开发高精度、高可靠性的定位与建图算法,包括但不限于在高精场景,轻图场景,端到端场景下解决相关cornercase问题;针对车载计算平台特性,优化算法性能与资源占用,提升系统实时性与鲁棒性。 2.参与多传感器(GNSS/LiDAR/IMU/轮速/视觉等)融合定位和建图算法设计和迭代优化。 3.参与在线语义地图构建、数据挖掘、云端模型、4dlabel等算法研发。 4.参与基于GNSS, IMU等传感器多场景下的实时车道级绑路、偏航算法,基于深度学习的地图匹配,航位推算等算法研发。 5.负责激光、视觉以及语义信息的三维重建、SLAM算法研发。支撑众包地图产线研发和量产落地,提升众包建图有效率。
1. VLA/VLN算法开发:研究并实现Vision-Language-Action (VLA) / Vision-Language Navigation(VLN)算法,使机器人能够根据自然语言指令以及当前场景进行自主移动; 2. 多模态融合:开发视觉、语言、地图等多模态信息融合模块,提升导航决策的准确性; 3. 场景理解:实现基于视觉和语言的场景语义理解,支持复杂环境下的目标定位与路径规划; 4. 模型训练与优化:负责VLA/VLN模型的训练、调优及推理性能优化; 5. 数据与评测:参与导航数据集构建、评测指标设计及Benchmark开发。
1、负责3D视觉、SLAM、机器学习、多传感器融合等算法在智能驾驶定位、建图等车载在线应用的研究、开发与落地 2、负责搭建模型训练所需高效数据生产链路(数据挖掘/增强)、负责模型训练实验