高德地图高德-资深多模态大模型/端到端自动驾驶算法专家-视觉团队
任职要求
1. 自然语言处理、计算机视觉、人工智能等相关专业的硕士生/博士生,对发文章有兴趣,具备良好的英文写作能力; 2. 发表过CV&AI顶会论文优先,ACM编程竞赛、数据建模竞赛等竞赛获奖优先。 3. 动手实现能力强,代码基本功扎实,精通基于Python的算法开发;熟练掌握pytorch/tensorflow/mxnet等至少一项深度学习框架。 4. 自驱力强、充满好奇心、团队合作、沟通能力佳。 我们需要这样的你 -有对于AGI的技术追求,对于前沿技术有浓厚兴趣,坚信AI驱动产品与业务创新 -有扎实的算法基础和动手能力,包含但不限于模型的训练、推理和部署等方面 -在大模型、多模态、AIGC、三维几何、自动驾驶、机器人等方面有丰富的项目经验
工作职责
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。
【岗位职责】 面向AI搜索、AI检索、智能助理等高价值业务场景,预研和落地AI核心技术,岗位职责包括但不限于: 1.针对AI检索智能体、大推理模型(r1/o1/o3)、多模态特征生成、端侧大模型、多模态检索、AI搜索推荐、检索增强生成(RAG)、个性化内容生成等核心难题,负责研发和突破关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新AI技术,形成技术影响力。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 【岗位资源】 1.真实大规模搜推广、智能助理业务场景需求、数据、AI开发平台、计算资源。 2.与知名高校资深老师团队科研合作,提供例行科研沟通合作机会。 3.业界资深研究员带队技术探索、落地、论文写作发表。
【岗位职责】 面向AI搜索、AI检索、智能助理等高价值业务场景,预研和落地AI核心技术,岗位职责包括但不限于: 1.针对AI检索智能体、大推理模型(r1/o1/o3)、多模态特征生成、端侧大模型、多模态检索、AI搜索推荐、检索增强生成(RAG)、个性化内容生成等核心难题,负责研发和突破关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新AI技术,形成技术影响力。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 【岗位资源】 1.真实大规模搜推广、智能助理业务场景需求、数据、AI开发平台、计算资源。 2.与知名高校资深老师团队科研合作,提供例行科研沟通合作机会。 3.业界资深研究员带队技术探索、落地、论文写作发表。
方向一: 岗位职责 面向应用商店、Agent助手、搜索、广告等高价值业务场景,预研和落地信息检索(搜索、推荐、广告)核心技术,岗位职责包括但不限于: 1.针对冷启动推荐、多场景多任务建模、自动特征工程、用户通用表征、多模态信息检索、对话推荐、端云推荐、检索增强生成(RAG)、智能体检索等核心难题,负责研发和突破信息检索关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新信息检索技术,发表高水平论文。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 方向二: 岗位职责 面向Agent助手、搜索、广告、应用商店等高价值业务场景,预研和落地智能体检索和推理大模型(r1/o1/o3)核心技术,岗位职责包括但不限于: 1.针对大推理模型(r1/o1/o3)、端侧大模型、多模态信息检索、AI搜索推荐、检索增强生成(RAG)、个性化内容生成、大模型特征生成等核心难题,负责研发和突破关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新信息检索技术,发表高水平论文。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 【岗位资源】 1.真实大规模搜推广、用户助手业务场景需求、数据、AI开发平台、计算资源。 2.与知名高校资深老师团队科研合作,提供例行科研沟通合作机会。 3.业界资深研究员带队技术探索、落地、论文写作发表。