logo of didi

滴滴算法工程师(VLM/LLM方向)(J250603009)

社招全职技术地点:杭州状态:招聘

任职要求


* 计算机科学、人工智能、机器学习或相关专业硕士及以上学历 
* 拥有 VLM(如 Qwen-VL系列,InternVL系列)或 LLM(如 GPT 系列、LLaMA)背景,具备大模型预训练、微调、推理或工程化经验 
* 精通至少一种深度学习框架(JAX、PyTorch、TensorF…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


* 基于 Vision-Language Models (VLM) 和 Large Language Models (LLM),设计与实现自动驾驶中行为预测与运动规划的基座模型(Foundation Model)
* 利用多模态预训练大模型进行轨迹生成与融合,提升基座模型对其他交通参与者意图的理解与预测能力
* 针对车端/云端部署,开展模型算法层面性能优化工作,例如压缩、剪枝、蒸馏、训练和推理加速等,确保模型可用性、系统实时性与资源利用率 
* 与算法、软件和系统团队紧密协作,推动模型集成及在仿真与真实车载平台的落地
包括英文材料
机器学习+
学历+
大模型+
GPT+
深度学习+
PyTorch+
还有更多 •••
相关职位

logo of didi
实习技术类

更新于 2025-07-04北京
logo of baidu
校招AIDU项目

VLM模型方向: -负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义; -负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。 VLM数据闭环方向: -负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作; -使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。

更新于 2025-05-19北京|上海
logo of baidu
校招AIDU项目

VLM模型方向: -负责基于VLM开源大模型与自动驾驶领域结合的专用自动驾驶VLM模型设计与实现,实现对复杂场景语义理解,给出决策语义或者行为语义; -负责对应模型调研、设计、研发与落地等工作,包含服务端大模型与车端小模型。 VLM数据闭环方向: -负责VLM模型训练与评价需要的数据爬取、挖掘、自动标注等核心算法工作; -使用业界大模型进行数据生成、标注等的训练、评价数据获取相关核心算法工作。

更新于 2025-07-23北京
logo of baidu
社招ACG

-负责 GUI Agent 专用 VLA 模型的训练与微调,包括基于 Qwen-VL、Qianfan-VL 等多模态模型的架构设计与实验迭代 -主导后训练全流程(SFT → RM → RL)的算法设计与落地,具备 RLHF / DPO 等对齐方法的工程实践经验 -设计并落地 GUI 操作轨迹数据的自动化采集、清洗与标注 Pipeline,推动数据飞轮闭环,驱动模型持续进化 -主导模型推理加速与生产部署,熟悉 vLLM、TensorRT-LLM 等推理框架及量化技术,持续优化端到端时延与吞吐量 -研究并落地适用于 GUI Agent 场景的高阶推理机制(多步规划、自我反思、动作验证等),持续跟踪前沿进展

更新于 2026-03-17北京