滴滴26届正式批-感知算法工程师-自动驾驶
任职要求
1、2026届毕业生,硕士及以上学历,计算机相关专业优先 2、编程基础扎实,熟悉基本算法和数据结构,至少熟悉以下一门语言:Python、C++ 3、熟悉深度学习框架,包括但不限于:PyTorch、TensorFlow等 4、善于思考,逻辑清晰,有优秀的问题分析和解决能力 5、有强烈的自我提升意愿,持续的自我驱动能力,关注业界前沿技术和国际会议研究动态,不断提升自己 6、良好的沟通和合作能力,责任心和团队意识强。 加分项: 有自动驾驶相关经验,包括但不限于:智能驾驶、机器人、等项目落地经验 在顶级国际会议/期刊上发表论文(CVPR,ICCV,ICML,NIPS等) 有编程、数学等相关竞赛成绩。
工作职责
自动驾驶中,感知团队的职责是根据传感器和高精地图的信息,对周围环境进行识别和理解,并对自车进行定位。在这里,你将研究和设计相关领域前沿算法,包括目标检测、分割、跟踪、场景理解、定位、模型压缩加速、基于大模型的数据挖掘与合成、半监督自监督、传感器标定等算法,直接赋能L4 无人车的大规模落地,创造社会价值和商业价值。一些项目包括: 1、感知大模型: 基于俯视图的多模态(激光雷达/相机)大模型,可支持多种任务,比如常见目标的检测、分割等 2、占据空间: 一种通用的目标检测方法,将周围环境抽象为占据、非占据的空间,解决开放世界层出不穷的异形物体识别问题,兜底感知召回能力,保证自车安全 3、端到端跟踪: 用基于深度学习的方法,替代经典的匈牙利匹配+卡尔曼滤波算法,通过数据驱动提升性能 4、场景理解: 通过编码周围环境中智能体和智能体、地图和地图、以及智能体和地图的交互关系,实现对相应场景的理解 (比如施工区连接、智能体是否是长停的车),直接影响自车行为(避让、跟随等) 5、基于大模型的数据挖掘/合成:调研和应用各种大模型,挖掘或合成高价值场景,提升模型相应场景表现 6、半监督自监督:调研和开发各种高效算法,降低模型对标注数据的依赖。
结合多源数据,打造高精度、高可靠性、低延迟的自动驾驶定位系统。包括但不限于: 1、结合业界前沿技术,如3D视觉、SLAM等,研发基于多源数据融合的定位算法,并负责将算法落地到自动驾驶汽车上 2、基于海量数据,打造自动化的定位数据闭环系统,提高系统迭代的效率和算法的泛化性 3、联合硬件、系统等团队,充分挖掘GNSS、IMU、里程计、视觉等传感器潜能,突破定位精度上限。
端到端自动驾驶大模型是当前工业界与学术界的研究热点,它通过数据驱动与科学建模,从原始传感器数据出发,直接预测自车未来行为,是AI与自动驾驶融合的综合应用。1、以海量真实数据为基础,依托计算机视觉、深度学习与大模型技术,构建面向真实世界的一体化决策规划模型 2、在端到端自动驾驶模型的设计与优化中,研究方向包括但不限于:端到端自动驾驶大模型优化、多模态融合与感知场景理解、大语言模型(VLM)驱动的复杂场景理解、基于扩散模型的预测与规划行为生成、三维空间表征与自监督预训练、 强化学习与人类行为偏好对齐等。
1、参与滴滴路径规划引擎研发,应用强化学习、图神经网络等技术优化全球不同区域的路线召回与排序策略,提升司乘出行效率 2、参与ETA(预估到达时间)、预估价核心算法迭代,通过时序建模和多任务学习图网络模型提升时间/距离/价格的预估准确性 3、研发实时路况预测系统,红绿灯智能读秒预测系统,构建智能的动态交通感知能力 4、探索大语言模型在交通领域的应用,将LLM技术与时空数据结合优化路线决策的可解释性 5、建设全球化路线引擎中台,针对不同国家地理特性,设计差异化解决方案。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。