理想汽车【智能空间】大模型算法专家
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟练Python等开发语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 2、5年以上NLP/CV相关的算法工作经验,熟悉NLP/CV等算法和技术,熟悉大模型后训练、RL算法; 3、在大模型领域,有较大影响力项目或论文者优先; 4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题; 5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
工作职责
主要工作方向包括: 1、推进大模型数据建设、指令微调、强化对齐等模型优化方面的工作,提升大模型能力和车机场景用户体验。 2、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 3、探索和落地适合车机场景智能体应用、以代码为中心的大模型智能体能力建设,提升车机个性化体验与复杂任务解决能力。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。
1.主导大模型驱动的智能体(Agent)算法研发,包括但不限于:自主决策、环境交互、多模态感知、长期记忆与持续学习等核心方向; 2.探索大模型与强化学习(RL)、规划推理(Planning)、知识图谱等技术的深度融合,提升智能体的任务泛化性与可解释性; 3.推动智能体技术在理想汽车相关场景的落地应用,解决实际业务问题。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。