蔚来大模型-端到端算法研发工程师
任职要求
职位要求: 1、具有深度学习、占据网络、目标检测、语义分割、多模态大模型及任一相关领域项目经验; 2、计算机、电子等相关专业背景;具备扎实的机器学习基础和较强的学习能力;有论文…
工作职责
职位描述: 1、负责智能辅助驾驶端到端算法的设计与研发工作,主要面向停车场/地库/园区低速场景,开发端到端planner模型; 2、负责端到端算法在智能辅助驾驶应用中的开发、迭代、优化、部署等。 职位地点:上海·汽车创新港
1. 负责端到端算法模型设计研发和工程落地,包括动静态元素感知,occupancy 感知,障碍物轨迹预测,行为决策等端到端算法; 2. 研发交付通用感知算法模型,具备query-base onemodel多模块交互能力,构建全场景空间感知能力和行为预测能力; 3. 构建端到端算法模型自监督训练框架,探索occupancy预训练空间智能方案,通过数据闭环持续迭代模型能力; 4. 持续提升端到端算法模型中occupancy性能指标,扩展occupancy 在3DGS与worldmodel上的应用。
我们是高德视觉技术中心,专注于以计算机视觉技术为核心的前沿研究与创新应用,致力于打造时空互联网领域的核心技术能力。 我们致力于构建 “真实世界 × 虚拟世界” 的生成式世界模型,引领多模态 AI 赋能智慧出行和日常生活。团队成员参与端到端 3D+视频+语言 大模型的研发,与阿里云算力、十亿级全域图像 / 点云 / 出行数据深度结合,让算法在真实应用中产生即时经济价值与社会影响力。 团队主页:https://github.com/amap-cvlab 岗位职责: 1. 核心算法研发:主导 1B-100B 参数级世界模型 / VLA / VLM 网络的整体方案与关键模块创新; 2. 高效预训练与微调:构建跨模态自监督目标(时序一致性、物理一致性、语言对齐等),并推动 SFT → DPO → RL-HF 全链路落地上线; 3. 跨模态推理与生成:针对 3D 场景、连续视频、语言描述开展对齐、生成与评估实验,推动端到端模型落地。创新3D场景/连续视频/交互策略/语言描述等跨多种模态的端到端理解与生成; 4. 产线落地与性能优化:与地图引擎、自动驾驶、智能导航等业务协同,迭代模型压缩、Edge-Cloud 混合部署、隐私数据训练; 5. 技术沉淀与传播:完成技术调研、实验复现、消融与报告撰写,将成果转化为论文、专利等技术沉淀。