logo of didi

滴滴26届正式批-多模态端到端算法工程师-自动驾驶

校招全职机器人类地点:北京 | 广州状态:招聘

任职要求


1、2026届毕业生,硕士及以上学历,研究方向为人工智能相关,包括但不限于计算机视觉深度学习自动驾驶等方向
2、编程基础扎实,熟悉基本算法数据结构,熟练掌握Python深度学习框架PyTorch
3、善于思考,逻辑清晰,有优秀的问题分析和解决能力
4、有强烈的自我提升意愿,持续的自我驱动能力,关注人工智能和计算机视觉业界前沿技术和国际会议研究动态,不断提升自己
5、良好的沟通和合作能力,责任心和团队意识强
6、需至少满足以下任意一项:(1) 在顶级国际会议/期刊上发表过论文(CVPRICCVECCVNeurIPSICLR等),有丰富的深度学习研究经验
(2)主导或作为核心参与过有影响力的开源项目的构建
(3)有自动驾驶相关经验,包括但不限于:智能驾驶、机器人、等项目落地经验
(4)有编程、数学等相关竞赛成绩。

工作职责


端到端自动驾驶大模型是当前工业界与学术界的研究热点,它通过数据驱动与科学建模,从原始传感器数据出发,直接预测自车未来行为,是AI与自动驾驶融合的综合应用。1、以海量真实数据为基础,依托计算机视觉、深度学习与大模型技术,构建面向真实世界的一体化决策规划模型
2、在端到端自动驾驶模型的设计与优化中,研究方向包括但不限于:端到端自动驾驶大模型优化、多模态融合与感知场景理解、大语言模型(VLM)驱动的复杂场景理解、基于扩散模型的预测与规划行为生成、三维空间表征与自监督预训练、 强化学习与人类行为偏好对齐等。
包括英文材料
学历+
OpenCV+
深度学习+
自动驾驶+
算法+
数据结构+
Python+
PyTorch+
CVPR+
ICCV+
ECCV+
NeurIPS+
相关职位

logo of didi
校招机器人类

自动驾驶中,感知团队的职责是根据传感器和高精地图的信息,对周围环境进行识别和理解,并对自车进行定位。在这里,你将研究和设计相关领域前沿算法,包括目标检测、分割、跟踪、场景理解、定位、模型压缩加速、基于大模型的数据挖掘与合成、半监督自监督、传感器标定等算法,直接赋能L4 无人车的大规模落地,创造社会价值和商业价值。一些项目包括: 1、感知大模型: 基于俯视图的多模态(激光雷达/相机)大模型,可支持多种任务,比如常见目标的检测、分割等 2、占据空间: 一种通用的目标检测方法,将周围环境抽象为占据、非占据的空间,解决开放世界层出不穷的异形物体识别问题,兜底感知召回能力,保证自车安全 3、端到端跟踪: 用基于深度学习的方法,替代经典的匈牙利匹配+卡尔曼滤波算法,通过数据驱动提升性能 4、场景理解: 通过编码周围环境中智能体和智能体、地图和地图、以及智能体和地图的交互关系,实现对相应场景的理解 (比如施工区连接、智能体是否是长停的车),直接影响自车行为(避让、跟随等) 5、基于大模型的数据挖掘/合成:调研和应用各种大模型,挖掘或合成高价值场景,提升模型相应场景表现 6、半监督自监督:调研和开发各种高效算法,降低模型对标注数据的依赖。

更新于 2025-08-18
logo of didi
校招算法类

1、负责多模态图像内容理解、语音、图计算等方向研发 2、技术落地应用:声纹识别、人脸识别、图像内容理解、图计算等方向 3、负责上述模型的工程化落地和业务策略使用。

更新于 2025-08-18
logo of didi
校招算法类

1、参与图像分类、目标检测/跟踪/分割、视频理解等算法开发与落地 2、参与大语言模型、多模态大模型开发与落地应用 3、跟踪业内最新技术成果,并应用到业务中。

更新于 2025-08-18
logo of didi
校招算法类

1、参与基于滴滴海量用户行为数据的上下车点推荐系统构建,包括召回,精排模型的优化等 2、参与基于大模型的POI数据建设,通过对多模态数据、地理位置、用户行为和LLM、NLP技术结合,打造最精准的POI数据体系 3、参与目的地检索推荐技术研发,包括向量召回、精排模型、检索agent等技术迭代。

更新于 2025-08-18