logo of hello

哈啰预测及端到端算法工程师-【自动驾驶】

社招全职软研类地点:上海 | 北京 | 广州状态:招聘

任职要求


1. 本科及以上学历,专业方向包括计算机、软件、自动化、模式识别等理工科,工作经验不小于2年;
2. 具备较强的编程能力,精通PythonC++语言,熟悉Docker容器化部署,有良好的编程习惯和标准化的代码风格;
3. 熟悉模型开发的基础流程体系,有样本生成、数据挖掘、模型训练、量化部署等全流程体系的开发经验;
4. 熟悉VectorNet、DenseTNT、QCNet等主流的预测/端到端模型,至少有1-2个预测/端到端模型的全流程开发及部署经验;
5. 掌握UniAD等主流的端到端模型框架,熟悉端到端自动驾驶算法最前沿的动态。

加分项:
1、具备数据驱动算法的研发能力,有预测/端到端模型算法的开发和优化经验;
2、熟悉端到端训练框架和联合训练;
3、熟悉主流的VLM/LLM模型,有用新技术在端到端大模型中的应用落地经验;
4、踏实靠谱,具备良好的团队内及跨团队沟通能力。

工作职责


1. 预测及端到端模型的选型、设计、训练和优化,并在车端SoC上部署,达到效率和一致性等要求;
2. 构建数据标注和评测流程,与工具链部门共同实现目标数据的挖掘及清洗,并基于模型表现对数据进行调整、配比等操作;
3. 运用深度学习、强化学习等技术,优化模型结构等,提高模型在复杂场景下的效果;
4. 利用数据增广、迁移学习和对比学习等方法,提升数据利用效率,优化模型泛化能力。
包括英文材料
学历+
模式识别+
Python+
C+++
Docker+
编程规范+
Transformer+
数据挖掘+
脚本+
算法+
自动驾驶+
大模型+
相关职位

logo of mi
校招

1. 设计适用于自动驾驶任务的Diffusion-based行为生成模型,涵盖轨迹预测、控制输出、长时规规划; 2. 研究基于图像和高维环境语义输入的扩散过程,支持条件生成与多模态控制分布建模; 3. 推动该方向模型从仿真到实车的部署,包括实时性优化、鲁棒性评估与反馈机制构建。 【课题名称】 Diffusion-based Nueral Planner 【课题内容】 探索扩散生成模型在端到端自动驾驶规划中的泛化能力和多模态决策潜力。以感知输入(图像、BEV等)直接生成控制信号(steering, acceleration),或隐式轨迹规划中间表示,构建具备不确定性建模、多样性采样和高分辨率行为预测能力的决策系统。参考如DiffPlan、MotionDiffuser、Wayformer+Diffusion等工作,推动视觉到控制的生成式范式演进。

更新于 2025-06-26
logo of mi
校招

1. 设计适用于自动驾驶任务的Diffusion-based行为生成模型,涵盖轨迹预测、控制输出、长时规规划; 2. 研究基于图像和高维环境语义输入的扩散过程,支持条件生成与多模态控制分布建模; 3. 推动该方向模型从仿真到实车的部署,包括实时性优化、鲁棒性评估与反馈机制构建。 【课题名称】 Diffusion-based Nueral Planner 【课题内容】 探索扩散生成模型在端到端自动驾驶规划中的泛化能力和多模态决策潜力。以感知输入(图像、BEV等)直接生成控制信号(steering, acceleration),或隐式轨迹规划中间表示,构建具备不确定性建模、多样性采样和高分辨率行为预测能力的决策系统。参考如DiffPlan、MotionDiffuser、Wayformer+Diffusion等工作,推动视觉到控制的生成式范式演进。

更新于 2025-06-26
logo of didi
校招机器人类

端到端自动驾驶大模型是当前工业界与学术界的研究热点,它通过数据驱动与科学建模,从原始传感器数据出发,直接预测自车未来行为,是AI与自动驾驶融合的综合应用。1、以海量真实数据为基础,依托计算机视觉、深度学习与大模型技术,构建面向真实世界的一体化决策规划模型 2、在端到端自动驾驶模型的设计与优化中,研究方向包括但不限于:端到端自动驾驶大模型优化、多模态融合与感知场景理解、大语言模型(VLM)驱动的复杂场景理解、基于扩散模型的预测与规划行为生成、三维空间表征与自监督预训练、 强化学习与人类行为偏好对齐等。

更新于 2025-08-18
logo of mi
校招

1. 负责视觉通用3D基础模型的研究及训练; 2. 实时3D重建算法的研究和开发; 3. 对3D开集检测的研究和开发; 4. 对重建的3D空间进行高阶拓扑抽象任务的研究; 5. 基于历史信息对未来帧预测的研究; 6. 负责相关领域前沿学术成果的调研,形成技术文档。 【课题名称】 空间智能 【课题内容】 纯视觉3D空间认知,同时具备室内和室外的泛化性,可在线重建3D空间(满足任意数量视角相机配置以及任意时序长度),任意前景物体的3D位置检测,具备空间拓扑的高阶抽象,以及对未来帧中空间拓扑的预测能力。

更新于 2025-06-26