高德地图AIGC多模态算法工程师-视频生成/理解方向-APP平台业务
任职要求
职位要求
1.理工科:计算机相关的硕士/博士在读;
2.在图像/视频生成领域有一定的经验,对大模型,diffusion,auto-regressive,RL,GRPO等相关技术掌握
3.对视频生成的aligment,high quality,long video,推理加速等方面有一…工作职责
团队介绍: 我们团队在多模态大模型,视频生成/视频理解等多个方向都有业界影响力的工作产出,在这里,你将与算法精英共事,提升你的技术实力和创新能力。团队可以为你提供足够的计算资源和数据资源。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,多篇论文入选paper digest最有影响力论文名单。 岗位职责包括但不限于: 1. 负责视频生成/视频理解技术的前沿技术的研究,并且能够使用到落地的视频生成模型中,提升视频生成模型的效果, 2. 针对视频生成的某一个领域问题,能够做到问题建模,创新性提出优化方法和模型训练; 3. 调研前沿技术,发表顶级论文。
1、负责抖音电商短视频和直播间的多模态内容理解、内容挖掘及结构化标签,构建内容分层体系,探索计算机视觉和多模态前沿技术,负责算法模型迭代升级,优化兴趣电商购物体验; 2、利用NLP、CV、多模态技术增强对电商内容理解的能力,在内容冷启、推搜策略、商达成长、供给生态等多个业务方向,支持电商业务目标高速发展; 3、负责AIGC图片/视频生成技术在电商领域的落地,参与电商基础模型构建以及AIGC能力在电商的价值探索; 4、负责抖店AIGC工具研发,不限于背景替换、虚拟试衣、文/图生视频等相关内容,积极跟进业界进展,推动技术在业务落地。
职位概述: 阿里云飞天实验室正在寻找一位充满激情的大模型应用开发者,加入我们的创新团队,共同构建和优化阿里云百炼大模型平台的核心应用组件, 开发以核心技术驱动的前沿应用的构建。我们专注于前沿的大模型能力,基于最新的模型能力,构建大模型应用,支持阿里云toB客户, 打造海内外和开源社区影响力。 团队介绍: 我们是一支致力于AGI,构建前沿的大模型应用范式的团队。 岗位描述: 1. 负责大规模语言基础模型,多模态模型,文生图、视频生成模型等AI能力的产品化落地工作。 2. 支持百炼大模型平台上应用组件、场景化应用的开发和落地。 3. 主要负责百炼大模型平台应用广场、MCP广场能生态能力建设。 加入我们,你将获得: 1. 与行业顶尖人才共事的机会。 2. 参与前沿技术研究和产品开发的平台。 3. 开放和包容的工作环境如果你渴望在一个充满活力和创新的环境中工作,并且对人工智能技术充满热情,我们期待你的加入!
团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包含但不限于: 1. 视觉理解任务的技术探索,要求对视觉基础任务有深入的理解,做好在商品理解、详情页的文图内容、开放图片识别等公司核心业务上的落地; 2. 多模态大模型的技术探索,要求对多模态大模型训练、文图跨模态对齐等有深入实践,做好多模态大模型的能力构建和应用; 3. 追踪领域前沿工作,沉淀技术,投稿领域顶级会议。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。