高德地图高德-多模态大模型应用算法工程师-视觉技术团队
任职要求
1、3年及以上工作经历,计算机科学、人工智能等相关专业硕士及以上学历; 2、熟悉多模态领域的重要算法和模型(如Qwen-VL、CLIP、Stable Diffusion等),掌握LoRA、SFT、RL等训练方法,有实际项目经验者优先; 3、熟练使用pytorch/deepspeed/transformers/ms-swift等框架,具备扎实的Python或C++编程能力; 4、在学术顶级会议(如CVPR、ICLR、NeurIPS等)发表过相关论文者优先; 5、具备较强的学习能力,能够快速掌握新技术,对新技术充满好奇心,具备高度的自驱力和韧性。
工作职责
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。
团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1. 跟进LLM / VLM大模型的最新技术动态,围绕Reasoning技术(如思维链、多步推理)、Long Context技术、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2. 面向垂直场景打造 LLM / VLM 应用体系,构建端到端数据链路,建立高稳定、低幻觉的模型交付框架,以极致的智能交互体验重塑用户在未来世界的生活与沟通方式。
1. 负责商品搜索相关的计算机视觉算法创新和研发,特别是大规模图像/多模态算法; 2. 服务于拍立淘图搜核心业务的视觉算法技术方向,包括商品多模态理解、图像理解、图像/多模态大模型应用; 3. 致力于为淘天大搜索核心业务打造行业领先的计算机视觉创新技术。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责多模态大模型的研发和应用,研究相关技术在豆包、智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力,研发以人工智能技术为核心的新技术、新产品; 2、探索超大规模模型,进行极致系统优化; 3、数据建设、指令微调、偏好对齐、模型优化; 4、相关应用落地,包括看图对话、问答、搜索、生成创作、逻辑推理、代码生成等; 5、在未来生活中的更多使用场景的深入研究和探索,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责多模态大模型的研发和应用,探索超大规模模型,进行极致系统优化;研究相关技术在豆包、智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力; 2、数据建设、指令微调、偏好对齐、模型优化; 3、相关应用落地,包括看图对话、问答、搜索、生成创作、逻辑推理、代码生成等; 4、在未来生活中的更多使用场景的深入研究和探索,研发以人工智能技术为核心的新技术、新产品;满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。