logo of antgroup

蚂蚁金服蚂蚁集团-多模态应用算法-端智能

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 计算机科学、人工智能、电子工程或相关领域,硕士或博士学位优先;
2. 在多模态理解生成、语音、计算机视觉、生成式UI等方向有大模型算法研究或应用落地经验;
3. 具备优秀…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 面向支付宝APP的智能化升级,探索基于多模态大模型的多模态理解、检索增强、视觉推理等技术方向,结合业务产品需求进行继续预训练、后训练等,推动产品业务创新;
2. 构建语音智能体交互入口,探索基于实时音视频的全双工交互模式下的情感陪伴、实时问答等场景应用,构建实时多模态交互、生成式UI等关键技术;
3. 持续跟进并关注多模态大模型方向的应用创新、技术前沿,共同参与定义支付宝智能化的技术应用创新和能力边界。
包括英文材料
学历+
OpenCV+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

我们是支付宝大模型应用算法团队,致力于推动大模型在真实产业场景中的前沿创新与落地应用。 团队的主要职责包括: 1. 推动AI能力在支付宝核心场景中的规模化落地。 2. 融合多源异构数据,构建精准、高效的用户意图理解与服务执行能力。 3.探索面向复杂任务的多智能体协同机制,设计涵盖推理、规划、执行等环节的多智能体协同算法。

更新于 2026-03-30北京|杭州
logo of baidu
社招MEG

-负责多模态大模型应用层算法研发与调优,涵盖文本、语音、视觉等模态的联合建模与任务优化 -设计并优化多模态对话、生成、检索、问答等核心能力,提升模型在跨模态场景下的推理与交互体验 -与产品、设计、前端团队紧密协作,推动多模态交互在移动端、Web 端及端侧设备上的落地 -持续跟进业界多模态应用进展(如智能助手、AI 修图/视频、跨模态搜索),快速完成技术评估与产品化 -通过数据分析与用户反馈,优化模型效果,提升业务关键指标(DAU、转化率、留存率等)

更新于 2026-03-25北京
logo of amap
社招3年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。

更新于 2025-12-11北京
logo of kuaishou
社招3-5年D10702

随本地生活业务多场景AI落地,构建AIGC、B/C端等智能服务的数据飞轮,主要工作涉及: 1. 用户数据分析和策略制定:分析用户交互数据和转化数据,评估不同商品和不同视频内容下用户的转化情况,制定选品、价格和内容优化策略; 2. 优化模型生成效果:负责模型训练数据构建与管理,参与数据筛选、标注及评测体系构建工作。分析和挖掘现有数据资源,通过数据驱动的方法优化,结合A/B测试等手段验证调整效果。

更新于 2025-08-11北京