快手多模态算法工程师（大模型方向）-【算法中心】

社招全职5-10年J00112026-03-24地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，对NLP/CV/多模态算法有深入的理解和实践，有大规模模型训练、微调、压缩、蒸馏等经验者优先；
2、有较强的学术调研、文献阅读和算法实现能力，优秀的独立开发、调试能力，有高质量学术论文、开源项目者优先；
3、具备AI模型…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 基于大模型的多模态内容理解技术研发与应用落地，涵盖文本、图像、音频、视频等多类型数据的融合处理；
2. 设计并优化多模态语义理解算法，包括但不限于跨模态检索、多模态内容生成、多模态情感分析、多模态语义匹配等；
3. 参与构建多模态内容理解系统，解决实际业务场景中的复杂问题，并应用于内容安全、生态治理、智能内容审核等核心业务中；
4. 跟踪国内外大模型与多模态技术前沿动态，将先进算法与技术转化为实际应用方案，推动技术创新与产品迭代。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

算法+

深度学习+

PyTorch+

TensorFlow+

还有更多 •••

登录查看完整学习资料

相关职位

多模态算法工程师（大模型方向）-【算法中心】

社招D7244

1、参与NLP/CV/多模态算法的研究和开发； 2、探索风控场景的大模型落地方案，应用于风控核心业务中。

更新于 2025-06-17北京

高德-多模态大模型算法工程师-空间智能方向-视觉技术中心

社招3年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页： https://github.com/amap-cvlab 为何加入我们？ 1. 挑战业界顶尖难题：处理百亿级位置数据，攻克动态世界中海量POI的实时、精准感知与理解，定义未来地图的“AI之眼”。 2. 驱动国民级应用创新：你的技术将直接应用于高德地图数亿用户依赖的扫街榜等核心功能，实现从技术突破到产品颠覆的全流程落地。 3. 置身前沿技术浪潮：在三维地图、世界模型、具身智能等前沿领域进行深度探索与研发。 4. 预研与业务深度结合：在这里，你将同时接触到面向未来的技术预研和支撑亿级用户的业务算法。我们提供从0到1的创新探索环境，也看重从1到N的规模化落地能力。职位描述：我们正在寻找一位专注多模态视觉理解的算法工程师。您将主要负责利用多模态大模型技术，从海量街景图片与视频中自动发现、识别与更新地图POI信息，提升地图数据的鲜度、广度与精度，为用户提供更智能、更沉浸的出行与生活服务。本岗位兼具前瞻性技术探索与规模化业务落地的双重属性，你将有机会完整参与从创新模型研究到核心业务系统迭代的全过程。主要职责： 1. 前瞻性模型预研与业务驱动研发：探索并研发适用于大规模街景图像/视频理解的下一代视觉-语言大模型（VLM），重点攻克POI变化发现、细粒度属性理解等关键课题，并将创新技术转化为实际业务解决方案。 2. 端到端业务落地与闭环优化：主导多模态POI发现技术在“高德扫街榜”等核心业务中的集成、优化与全流程落地。 3. 前沿技术跟踪与创新：持续跟踪多模态理解、视频表征学习、地理空间智能等领域的最新进展，探索技术边界发表高质量论文，实现空间感知理解的学术突破，持续迭代核心算法，达到业界sota。

更新于 2025-12-31北京

算法研发工程师（上海）-26届校招

校招算法

团队介绍： -AI服务中心致力于通过AIGC赋能爱奇艺在内容创作和用户体验上的持续创新，团队研发方向包括大模型文本算法、图像算法、多模态算法和Agent方案的设计实现，欢迎愿意长期深耕AI领域的同学加入我们。岗位职责： -负责AIGC核心算法的研发与优化，包括大语言模型、扩散模型等方向，生文、生图、生视频等应用领域； -结合业务需求，快速完成算法原型开发和相关AI Agent方案设计开发，推动在实际场景中的落地和性能优化； -完整的算法模型训练、微调、评估和部署流程； -参与AI领域最新进展的技术调研、引入改造、原型设计与开发等。

更新于 2025-12-16上海

高德-多模态大模型算法工程师/专家-图片理解/模型训练方向

社招3年以上技术类-算法

职位名称：团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现空间智能、高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页：https://github.com/amap-cvlab 为何加入我们？ 1. 定义未来地图范式：不再局限于传统视觉感知，而是利用多模态大模型实现从“看到”到“理解并生成”的跨越，解决行业核心痛点 2. 直面海量数据与复杂场景：处理中国乃至全球最复杂、最丰富的驾驶场景数据，构建坚实的技术壁垒 3. 完整的研发生态：从顶级学术研究（顶会论文）、开源项目（见团队GitHub）到国民级应用落地，提供全方位的价值实现舞台岗位职责： 1. 核心方向：研发面向车道级地图自动化构建的多模态大模型，基于道路图像自动提取车道线、POI信息等地图要素，实现高效、自动化的地图数据生产； 2. 模型全链路研发：负责或参与多模态大模型的预训练、有监督微调（SFT）、奖励模型（RM）训练与强化学习（RL）优化全流程，探索模型在空间推理、结构化生成任务上的能力强化路径； 3. 技术攻坚与落地：优化模型的推理效率、泛化能力与输出稳定性，研究适配的模型压缩（量化、蒸馏）、加速技术与部署方案，推动技术在大规模数据生产管线中落地； 4. 前沿探索与创新：跟踪并吸收多模态理解、视觉生成、世界模型、3DGS等领域的前沿进展，将其创新性地应用于地图生成问题，持续提升自动化生产的质量与范围。

更新于 2026-03-30北京