
文远知行感知算法工程师 -- 机器学习/视觉和算法工程师(2026届校招)
任职要求
你: 1.同时具有很强的算法和C++编程能力; 2.或者在机器学习/深度学习,计算机视觉,模型优化等至少一个方向上有扎实的基础和丰富的经验; 3.拥有强大的逻辑思维能力,算法能力,以及解决问题的能力; 4.具有良好的沟…
工作职责
base地 北京/上海/广州/深圳 关于感知方向 感知是无人驾驶中非常复杂和有趣的部分之一,你构建的是一个人工智能集大成的系统,不是一项按部就班就能完成的工作!感知软件工程师负责无人驾驶感知系统的设计和实现,应对无人驾驶中各种最有挑战的问题: 设计高效可靠的深度学习模型,在几十毫秒内精确检测和跟踪车周围200米之内所有的障碍物(人,车,非机动车辆,交通锥等),并对场景进行理解 如何设计一般性的模型和算法去处理各式各样的长尾情况和极端环境,如路面上的垃圾袋,洒水车的水花,前车掉下来的挡板 ,如大雨,大雪,雾霾,风沙等 如何保证感知模型和算法在极端的环境里的准确性和可靠性,如大雨,大雪,雾霾,风沙等 把模型优化到极致,让十几个到几十个模型在车上有限的计算资源上欢快的运行。 如何搭建一个高效可靠的计算框架,支撑一个周期内接收几十个传感器的输入,做各种同步融合,并进行几十个深度学习模型的推理 关于机器学习和算法方向 这个方向的感知工程师负责设计并实现传感器标定,障碍物检测,分类,跟踪,和场景理解等各种模型和算法,VLM视觉语言模型落地,对模型和算法进行评估和测试, 并把模型和算法部署到车上。

关于感知方向 感知是无人驾驶中非常复杂和有趣的部分之一,你构建的是一个人工智能集大成的系统,不是一项按部就班就能完成的工作!感知软件工程师负责无人驾驶感知系统的设计和实现,应对无人驾驶中各种最有挑战的问题: 1. 设计高效可靠的深度学习模型,在几十毫秒内精确检测和跟踪车周围200米之内所有的障碍物(人,车,非机动车辆,交通锥等),并对场景进行理解 2. 如何设计一般性的模型和算法去处理各式各样的长尾情况和极端环境,如路面上的垃圾袋,洒水车的水花,前车掉下来的挡板 ,如大雨,大雪,雾霾,风沙等 3. 如何保证感知模型和算法在极端的环境里的准确性和可靠性,如大雨,大雪,雾霾,风沙等 4. 把模型优化到极致,让十几个到几十个模型在车上有限的计算资源上欢快的运行 5. 如何搭建一个高效可靠的计算框架,支撑一个周期内接收几十个传感器的输入,做各种同步融合,并进行几十个深度学习模型的推理 关于机器学习和算法方向 这个方向的感知工程师负责设计并实现传感器标定,障碍物检测,分类,跟踪,和场景理解等各种模型和算法,对模型和算法进行评估和测试,并把模型和算法部署到车上。
公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)
1. 路径规划 ‒ 开发适用于多种场景(如机器人导航、自动驾驶、无人机等)的路径规划算法; ‒ 实现经典和前沿的全局及局部路径规划方法(如 A*、Dijkstra、RRT、DWA 等),优化路径规划的效率和鲁棒性; ‒ 处理动态环境中的路径生成和调整,解决复杂场景下的避障问题。 2. 行动决策 ‒ 研究并实现具身智能体的行动决策算法,设计任务分解和行为选择的逻辑; ‒ 基于行为树(Behavior Tree)、有限状态机(FSM)等方法,构建模块化的决策框架; ‒ 开发多智能体协作与竞争的行动决策模型,支持复杂交互任务的执行。 3. 强化学习(Reinforcement Learning,RL) ‒ 针对具身智能场景(如机械臂控制、机器人动态避障、导航等),设计强化学习的 reward 函数和训练策略; ‒ 实现主流深度强化学习算法(如 DQN、DDPG、PPO、SAC 等),解决高维连续控制与探索问题; ‒ 优化强化学习模型的收敛速度和鲁棒性,提升算法在实际场景中的表现。 4. 模仿学习(Imitation Learning,IL) ‒ 通过专家示范数据(如轨迹、动作序列)训练智能体,实现模仿人类/智能体行为; ‒ 应用行为克隆(Behavior Cloning, BC)、逆强化学习(Inverse Reinforcement Learning, IRL)等技术解决稀疏奖励问题; ‒ 结合模仿学习与强化学习,提升智能体在复杂任务中的学习和泛化能力。 5. 算法优化与工程实现 ‒ 优化算法的计算效率和资源占用,适配实时性要求 ;‒ 在仿真环境(如 Gazebo、PyBullet、Mujoco 等)和真实设备中验证算法性能; ‒ 配合嵌入式团队完成算法在终端设备上的部署与优化。 6. 技术研究与创新 ‒ 跟踪具身智能领域的前沿算法进展,探索新技术的实际应用; ‒ 研究多模态感知与决策(如视觉、语音、触觉)的融合方法,提升智能体的环境理解与行动能力; ‒ 参与长期自主学习、在线学习和自适应学习系统的设计与开发。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1. 多模态大模型研发与应用 负责多模态大模型的核心架构设计,研究并实现图片、视频、文本等跨模态特征对齐、融合与表征学习方法,负责多模态大模型的数据准备、高效训练(包括但不限于预训练、SFT、强化学习等)、推理加速等。 2. 模型优化与小型化部署 负责多模态大模型的轻量化设计、压缩与加速,确保模型在端侧设备上的高效运行。 针对高德地图的实际业务场景,优化模型性能,平衡精度与效率。 3. 创新性研究与落地 跟踪端侧生成式AI(Edge Generative AI)、强化学习(PPO、GRPO等)、智能Agent等前沿技术,探索多模态大模型在自动驾驶、智能导航等领域的潜在应用。 将研究成果快速转化为实际产品功能,推动技术创新与业务增长。