滴滴26届正式批-多模态端到端算法工程师-自动驾驶
校招全职机器人类地点:北京 | 广州状态:招聘
任职要求
1、2026届毕业生,硕士及以上学历,研究方向为人工智能相关,包括但不限于计算机视觉、深度学习和自动驾驶等方向 2、编程基础扎实,熟悉基本算法和数据结构,熟练掌握Python和深度学习框架PyTorch 3、善于思考,逻辑清晰,有优秀的问题分析和解决能力 4、有强烈的自我提升意愿,持续的自我驱动能力,关注人工智能和计算机视觉业界前沿技术和国际会议研究动态,不断提升自己 5、良好的沟通和合作能力,责任心和团队意识强 6、需至少满足以下任意一项:(1) 在顶级国际会议/期刊上发表过论文(CVPR,ICCV,ECCV,NeurIPS,ICLR等),有丰富的深度学习研究经验 (2)主导或作为核心参与过有影响力的开源项目的构建 (3)有自动驾驶相关经验,包括但不限于:智能驾驶、机器人、等项目落地经验 (4)有编程、数学等相关竞赛成绩。
工作职责
端到端自动驾驶大模型是当前工业界与学术界的研究热点,它通过数据驱动与科学建模,从原始传感器数据出发,直接预测自车未来行为,是AI与自动驾驶融合的综合应用。1、以海量真实数据为基础,依托计算机视觉、深度学习与大模型技术,构建面向真实世界的一体化决策规划模型 2、在端到端自动驾驶模型的设计与优化中,研究方向包括但不限于:端到端自动驾驶大模型优化、多模态融合与感知场景理解、大语言模型(VLM)驱动的复杂场景理解、基于扩散模型的预测与规划行为生成、三维空间表征与自监督预训练、 强化学习与人类行为偏好对齐等。
包括英文材料
学历+
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
ECCV+
https://eccv.ecva.net/
ECCV is the official event under the European Computer Vision Association and is biannual on even numbered years.
NeurIPS+
https://neurips.cc/
ICLR+
https://iclr.cc/
相关职位
校招机器人类
自动驾驶中,感知团队的职责是根据传感器和高精地图的信息,对周围环境进行识别和理解,并对自车进行定位。在这里,你将研究和设计相关领域前沿算法,包括目标检测、分割、跟踪、场景理解、定位、模型压缩加速、基于大模型的数据挖掘与合成、半监督自监督、传感器标定等算法,直接赋能L4 无人车的大规模落地,创造社会价值和商业价值。一些项目包括: 1、感知大模型: 基于俯视图的多模态(激光雷达/相机)大模型,可支持多种任务,比如常见目标的检测、分割等 2、占据空间: 一种通用的目标检测方法,将周围环境抽象为占据、非占据的空间,解决开放世界层出不穷的异形物体识别问题,兜底感知召回能力,保证自车安全 3、端到端跟踪: 用基于深度学习的方法,替代经典的匈牙利匹配+卡尔曼滤波算法,通过数据驱动提升性能 4、场景理解: 通过编码周围环境中智能体和智能体、地图和地图、以及智能体和地图的交互关系,实现对相应场景的理解 (比如施工区连接、智能体是否是长停的车),直接影响自车行为(避让、跟随等) 5、基于大模型的数据挖掘/合成:调研和应用各种大模型,挖掘或合成高价值场景,提升模型相应场景表现 6、半监督自监督:调研和开发各种高效算法,降低模型对标注数据的依赖。
更新于 2025-08-18
校招算法类
1、负责多模态图像内容理解、语音、图计算等方向研发 2、技术落地应用:声纹识别、人脸识别、图像内容理解、图计算等方向 3、负责上述模型的工程化落地和业务策略使用。
更新于 2025-08-18