logo of didi

滴滴交通大数据-语义感知-算法实习生

实习兼职技术类地点:北京状态:招聘

任职要求


1、具备深度学习理论基础,熟悉常见深度学习框架(如PyTorchTensorFlow)。
2、掌握卷积神经网络(CNN)、Transformer等核心模型架构,了解目标检测、分割等视觉任务的经典算法,具备独立设计和实现神经网络模型的能力。
3、熟悉MapTR、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


探索计算机视觉、大模型等技术在现实场景理解的落地应用
包括英文材料
深度学习+
PyTorch+
TensorFlow+
CNN+
还有更多 •••
相关职位

logo of didi
社招技术

公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2025-11-20北京
logo of weride
社招

高精地图和定位团队介绍 如果将无人车和人脑类比,高精地图和定位系统大致对应于后者中掌管空间记忆、感知和定位的部分。它的使命是为无人车提供翔实准确的道路3D几何和语义信息,让无人车对行驶环境了如指掌,从而在其中行动自如,我们同时还负责提供高速、精准的3D定位,让车辆每时每刻都知晓当前的精确位置。高精地图和定位在无人车技术栈中占据着非常重要的位置,感知、规划、控制、仿真等各大模块都要依赖它提供的道路环境以及车辆位置的信息对周围世界进行理解,做出正确的决策。文远知行的高精地图和定位团队和公司一起成长,完全自主构建了大规模高精地图,覆盖中美多个城市超过3000公里道路,提供精确达厘米级的3D结构数据以及车道线、交通信号等大量语义信息。自行研发的定位技术,基于激光雷达、相机、卫星及惯性导航等多传感器融合,能提供实时的厘米级定位,成功实现了在暴雨中自动驾驶穿越1.5公里长隧道。 在人工智能的应用中,高精地图和定位是比较独特的。我们知道,计算机视觉作为人工智能的重要分支,其核心问题分为语义理解和几何理解两大类,前者以解析图像中物体或场景的语义信息为目的,后者的目标则是重构3D场景以及对物体进行3D定位。在高精地图和定位系统中,恰恰这两大类技术都有着非常关键的应用。除此之外,我们还是高精度卫星、惯性导航等硬件的重度用户,多模态信号处理和融合更是我们的核心技术之一。因此,这是一个多学科高度综合的应用,无论你精通深度学习等机器学习技术,还是专攻3D重建、SLAM,又或是信号处理、多传感器融合高手,这里都有你一展身手的广阔空间。同时,我们致力搭建大规模、高可用的高精度地图系统,大数据和全栈开发的编程精英同样能找到用武之地。 1. 基于深度学习打造不依赖高精度地图的定位和实时地图系统,包括模型设计、训练、部署,车上系统反馈和形成数据闭环 2. 设计和构建深度神经网络模型,用于对传感器数据进行特征提取、数据融合和位置估计 3. 处理和分析大规模的自动驾驶系统相关的Camera、Lidar、GPS和IMU等各种传感器数据,利用深度学习技术进行特征提取、数据建模和预测分析 4. 进行深度学习模型的调优和调参,以提高模型的性能、效率和鲁棒性

更新于 2025-08-01广州
logo of weride
社招

高精地图和定位团队介绍 如果将无人车和人脑类比,高精地图和定位系统大致对应于后者中掌管空间记忆、感知和定位的部分。它的使命是为无人车提供翔实准确的道路3D几何和语义信息,让无人车对行驶环境了如指掌,从而在其中行动自如,我们同时还负责提供高速、精准的3D定位,让车辆每时每刻都知晓当前的精确位置。高精地图和定位在无人车技术栈中占据着非常重要的位置,感知、规划、控制、仿真等各大模块都要依赖它提供的道路环境以及车辆位置的信息对周围世界进行理解,做出正确的决策。文远知行的高精地图和定位团队和公司一起成长,完全自主构建了大规模高精地图,覆盖中美多个城市超过3000公里道路,提供精确达厘米级的3D结构数据以及车道线、交通信号等大量语义信息。自行研发的定位技术,基于激光雷达、相机、卫星及惯性导航等多传感器融合,能提供实时的厘米级定位,成功实现了在暴雨中自动驾驶穿越1.5公里长隧道。 在人工智能的应用中,高精地图和定位是比较独特的。我们知道,计算机视觉作为人工智能的重要分支,其核心问题分为语义理解和几何理解两大类,前者以解析图像中物体或场景的语义信息为目的,后者的目标则是重构3D场景以及对物体进行3D定位。在高精地图和定位系统中,恰恰这两大类技术都有着非常关键的应用。除此之外,我们还是高精度卫星、惯性导航等硬件的重度用户,多模态信号处理和融合更是我们的核心技术之一。因此,这是一个多学科高度综合的应用,无论你精通深度学习等机器学习技术,还是专攻3D重建、SLAM,又或是信号处理、多传感器融合高手,这里都有你一展身手的广阔空间。同时,我们致力搭建大规模、高可用的高精度地图系统,大数据和全栈开发的编程精英同样能找到用武之地。 自动驾驶高精地图系统研发,实现大规模分布式建图和快速更新。工作内容包括但不限于: 分布式数据处理系统的构建、性能优化与维护 云端建图微服务的构建、部署与维护 车载地图相关系统的构建,性能及可靠性优化 地图质量评测系统搭建与维护

更新于 2025-08-01广州
logo of weride
社招

公司介绍: 文远知行(WeRide)成立于 2017 年,是全球领先的 L4 级自动驾驶科技公司,致力于“以无人驾驶改变人类出行”,已在全球超过 25 个城市开展自动驾驶研发、测试及运营,累积自动驾驶里程超1600万公里,应用场景覆盖智慧出行、智慧货运和智慧环卫,形成自动驾驶出租车、自动驾驶小巴、自动驾驶货运车、自动驾驶环卫车、高阶智能驾驶等五大产品矩阵,提供网约车、随需公交、同城货运、智能环卫、高阶智能驾驶解决方案等多种服务。 凭借“1个平台+3大场景+5大产品”的多元商业化战略,文远知行商业营收居同类自动驾驶企业之首,已与多家全球顶级主机厂和一级供应商达成战略合作伙伴关系,包括雷诺日产三菱联盟、宇通集团、博世、广汽集团等,不断为人类出行提供更多新选择。 文远知行目前的团队既有来自谷歌、微软、亚马逊、苹果、百度、滴滴的高阶工程师,也不乏刚从顶尖高校毕业的青年才俊。来到我们当中,你会发现这是一个专业、专注、有趣、有料的队伍。大家为了一个激动人心而富有挑战的目标走到一起,互相激励、脑力碰撞,为实现产品落地、创造社会价值、推进行业技术而努力。 对有抱负的工程师,还有什么比这更有意义的呢?我们虚位以待,真诚期待技术过硬、志趣相投的小伙伴加入我们! 更多信息请访问:http://www.weride.ai,或关注官方微信号:文远知行WeRide 高精地图和定位团队介绍 如果将无人车和人脑类比,高精地图和定位系统大致对应于后者中掌管空间记忆、感知和定位的部分。它的使命是为无人车提供翔实准确的道路3D几何和语义信息,让无人车对行驶环境了如指掌,从而在其中行动自如,我们同时还负责提供高速、精准的3D定位,让车辆每时每刻都知晓当前的精确位置。高精地图和定位在无人车技术栈中占据着非常重要的位置,感知、规划、控制、仿真等各大模块都要依赖它提供的道路环境以及车辆位置的信息对周围世界进行理解,做出正确的决策。文远知行的高精地图和定位团队和公司一起成长,完全自主构建了大规模高精地图,覆盖中美多个城市超过3000公里道路,提供精确达厘米级的3D结构数据以及车道线、交通信号等大量语义信息。自行研发的定位技术,基于激光雷达、相机、卫星及惯性导航等多传感器融合,能提供实时的厘米级定位,成功实现了在暴雨中自动驾驶穿越1.5公里长隧道。 在人工智能的应用中,高精地图和定位是比较独特的。我们知道,计算机视觉作为人工智能的重要分支,其核心问题分为语义理解和几何理解两大类,前者以解析图像中物体或场景的语义信息为目的,后者的目标则是重构3D场景以及对物体进行3D定位。在高精地图和定位系统中,恰恰这两大类技术都有着非常关键的应用。除此之外,我们还是高精度卫星、惯性导航等硬件的重度用户,多模态信号处理和融合更是我们的核心技术之一。因此,这是一个多学科高度综合的应用,无论你精通深度学习等机器学习技术,还是专攻3D重建、SLAM,又或是信号处理、多传感器融合高手,这里都有你一展身手的广阔空间。同时,我们致力搭建大规模、高可用的高精度地图系统,大数据和全栈开发的编程精英同样能找到用武之地。 定位算法工程师 北京或广州或深圳 与地图及定位系统相关的,基于相机、lidar、GNSS、轮速计、IMU等多种传感器的各种智能算法的研发。工作涉及但不限于:多传感器融合建图和定位算法开发、传感器校准、点云数据处理、地图元素自动识别和智能标注等。

更新于 2025-08-01广州