滴滴26届正式批-多模态端到端算法工程师-自动驾驶
任职要求
1、2026届毕业生,硕士及以上学历,研究方向为人工智能相关,包括但不限于计算机视觉、深度学习和自动驾驶等方向 2、编程基础扎实,熟悉基本算法和数据结构,熟练掌握Python和深度学习框架PyTorch 3、善于思考,逻辑清晰,有优秀的问题分析和解决能力 4、有强烈的自我提升意愿,持续的自我驱动能力,关注人工智能和计算机视觉业界前沿技术和国际会议研究动态,不断提升…
工作职责
端到端自动驾驶大模型是当前工业界与学术界的研究热点,它通过数据驱动与科学建模,从原始传感器数据出发,直接预测自车未来行为,是AI与自动驾驶融合的综合应用。1、以海量真实数据为基础,依托计算机视觉、深度学习与大模型技术,构建面向真实世界的一体化决策规划模型 2、在端到端自动驾驶模型的设计与优化中,研究方向包括但不限于:端到端自动驾驶大模型优化、多模态融合与感知场景理解、大语言模型(VLM)驱动的复杂场景理解、基于扩散模型的预测与规划行为生成、三维空间表征与自监督预训练、 强化学习与人类行为偏好对齐等。
自动驾驶中,感知团队的职责是根据传感器和高精地图的信息,对周围环境进行识别和理解,并对自车进行定位。在这里,你将研究和设计相关领域前沿算法,包括目标检测、分割、跟踪、场景理解、定位、模型压缩加速、基于大模型的数据挖掘与合成、半监督自监督、传感器标定等算法,直接赋能L4 无人车的大规模落地,创造社会价值和商业价值。一些项目包括: 1、感知大模型: 基于俯视图的多模态(激光雷达/相机)大模型,可支持多种任务,比如常见目标的检测、分割等 2、占据空间: 一种通用的目标检测方法,将周围环境抽象为占据、非占据的空间,解决开放世界层出不穷的异形物体识别问题,兜底感知召回能力,保证自车安全 3、端到端跟踪: 用基于深度学习的方法,替代经典的匈牙利匹配+卡尔曼滤波算法,通过数据驱动提升性能 4、场景理解: 通过编码周围环境中智能体和智能体、地图和地图、以及智能体和地图的交互关系,实现对相应场景的理解 (比如施工区连接、智能体是否是长停的车),直接影响自车行为(避让、跟随等) 5、基于大模型的数据挖掘/合成:调研和应用各种大模型,挖掘或合成高价值场景,提升模型相应场景表现 6、半监督自监督:调研和开发各种高效算法,降低模型对标注数据的依赖。
1. 负责滴滴代驾乘客端App、小程序,司机端App,以及运营和营销平台等系统的研发工作; 2. 与产品、设计沟通,并能够针对不同业务需求给出前端技术解决方案; 3. 深度参与App和小程序的性能优化、稳定性保障、架构升级,以及组件化建设等相关工作,提升软件体验和研发效率;
1、负责云音乐AI基建平台相关业务相关服务端开发; 2、负责业务AI相关落地; 3、根据产品需求完成服务器端设计、开发以及文档编写等工作; 4、优化系统性能, 改善系统的稳定性及易用性,提升用户体验。