logo of didi

滴滴27届秋储-视觉算法实习生(AloT产品事业部)

实习兼职算法类地点:北京状态:招聘

任职要求


1、2027届在校生,硕士及以上学历, 计算机视觉模式识别机器学习、电子信息等相关专业优先
2、熟练掌握视觉领域的基础理论和方法,在一个或多个领域有深入研究:检测、分割、BEV、半监督/无监督、视频生成、多模态、视频理解等
3、有辅助驾驶算法研发经验优先,有图像视频生成、图像理解问答相关的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与图像分类、目标检测/跟踪/分割、视频理解等算法开发与落地
2、参与辅助驾驶相关算法开发,复现业界最新进展,沉淀平台算法能力
3、参与大语言模型、多模态大模型开发与落地应用。
包括英文材料
学历+
OpenCV+
模式识别+
机器学习+
算法+
大模型+
数据分析+
还有更多 •••
相关职位

logo of didi
实习算法类

1、从事交通场景下的场景理解、目标检测与识别 2、从事机器学习基础框架的优化和改进 3、将相关应用场景中的问题转化成数据模型或者科学问题,并尝试提出解决方案。

更新于 2026-04-06北京
logo of didi
实习机器人类

参与L4无人驾驶安全兜底算法设计,针对极端场景,研究和构建AEB系统。探索和应用预训练多模态大模型/生成式 AI算法,持续跟进前沿进展,运用前沿技术赋能自动驾驶、构建高效数据闭环系统。将大模型成果迁移到真实车队感知系统中,针对corner case设计解决方案,解决长尾问题,提升复杂场景下的鲁棒性。

更新于 2026-05-11北京
logo of didi
校招机器人类

1、多模态大模型(VLM)算法研发:参与视觉语言大模型训练、微调、对齐流程,包括数据处理、模型训练、推理优化、效果迭代 2、数据集构建与清洗:负责图文配对数据、视觉推理数据、OCR数据、视频理解数据的筛选、清洗、质量评估 3、模型微调与对齐:负责VLM SFT、RLHF等后训练环节方案落地,优化模型幻觉、图文匹配、推理能力 4、评测体系搭建:跟进VLM通用评测基准,完成视觉问答、图文理解、逻辑推理能力评测,产出评测报告 5、前沿技术调研:跟进国内外SOTA多模态模型(Qwen-VL等),复现前沿算法,沉淀技术方案 6、工程落地优化:参与模型部署适配,优化显存占用、推理延迟,服务业务线上场景。

更新于 2026-05-22广州
logo of didi
社招3-5年技术

1、负责公司内部工作台中后台系统和H5的前端研发工作,包括需求分析、设计、编码和维护; 2、参与前端技术选型和技术方案制定,推动团队技术革新和进步; 3、与团队成员紧密协作,按时高质量完成项目开发任务; 4、关注用户体验,持续优化产品交互和性能; 5、负责相关技术文档的编写和维护。

更新于 2025-03-27杭州