logo of aliyun

阿里云研究型实习生 - 深度融合大模型能力的NL2SQL小模型工具

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


解决如下挑战(发表论文和代码实现):
1、多轮问答,在询问的过程中往往存在多轮下钻问询的过程,以厘清模糊或者二义信息,这是语言大模型的强项。 如何利用该强项, 把自然语言的问询变成一个标准规范的语言描述, 以便于使用告诉准确的nl2sql生成工具;
2、SQL中可能涉及大量领域自定义函数(例如时空数据库),不同函数…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


以语言大模型为代表的AI如火如荼,但在NL2SQL这个数据库垂直技术领域, 纯粹依赖大模型存在推理速度慢,生成准确度不稳定等不足。 该研发项目围绕在大模型结合小模型,用小模型在专域上加强大模型的不足作为突破点,将大模型的能力延展到以SQL语法为引导下开发的小模型工具。目标是让NL2SQL能力成为大模型在数据库查询领域的一个专用工具, 做到快速, 准确,高效。
包括英文材料
大模型+
还有更多 •••
相关职位

logo of antgroup
实习研究型实习生

研究领域: 深度学习 项目简介: 随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据; 以下两个关键点需要投入人力研究: 1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度; 2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;

杭州
logo of amap
实习高德研究型实习生

多模态大模型算法实习生 深度参与亿级用户产品的AI核心能力建设,有机会将研究成果落地于高德,影响亿万用户; 岗位职责 ꔷ 参与多模态表征学习与全模态交互模型的研究与开发,探索文本、图像、语音、地理信息等多源异构数据的深度融合方法; ꔷ 聚焦用户多模态指令理解(如“找附近有露营氛围的咖啡馆”)、商铺及内容的多模态理解(图文、视频、评论、POI属性等),构建面向高德搜索、推荐与智能交互场景的AI Agent能力; ꔷ 设计并实现创新性算法,在真实业务场景中验证效果,提升用户获取信息的有效性、趣味性与沉浸感; ꔷ 推动技术前沿探索,目标在顶会发表高质量学术论文,打造业界领先的多模态AI系统。

更新于 2025-11-21北京
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 随着人工智能技术的快速发展,机器人领域正从传统的工业自动化向智能化、消费级方向转变。桌面机器人作为面向用户的电子消费品,旨在通过视觉、语言和行动(VLA,Vision-Language-Action)的深度融合,实现与人类的自然交互,并完成复杂的任务。这类机器人不仅可以提高用户的生活质量,还能在教育、娱乐、办公等场景中提供智能化服务。

上海
logo of alibaba
实习淘天集团研究型实

依托淘宝、天猫超大规模商业场景,我们致力于通过最前沿的多模态大模型技术驱动万亿级交易额的增长。在这里你将面对业界最复杂的电商图文、视频语境,与顶尖团队一起探索 AIGC 与多模态技术在搜索广告全链路(召回、排序、创意生成)的深度融合与变现。包括并不限于: 1. 负责电商多模态统一表征: 构建面向海量商品、直播、短视频的超大规模预训练模型(VLM),解决多模态语义对齐、细粒度特征提取及跨模态检索难题。 2. 负责生成式广告物料(AIGC): 探索 Diffusion Model、LLM 在广告创意自动生成(文案、头图、视频步进)中的应用,提升物料投放质量与点击转化率。 3. 负责多模态驱动的商业决策: 将多模态感知能力深度注入广告全链路(从搜索词理解到广告 CTR/CVR 预估),实现从“看懂图片”到“理解意图”的决策升级。 4. 负责全链路多物料优化: 针对商品、直播间、短视频等多类型物料,设计统一的跨模态排序算法,优化搜索场景下的多元流量分配效率。 5. 负责视觉底层技术创新: 针对电商复杂场景,优化 OCR、商品检测、度量学习及视觉搜索等经典任务,建立行业领先的视觉基座。

更新于 2026-01-27北京|杭州