logo of aliyun

阿里云研究型实习生 - 深度融合大模型能力的NL2SQL小模型工具

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


解决如下挑战(发表论文和代码实现):
1、多轮问答,在询问的过程中往往存在多轮下钻问询的过程,以厘清模糊或者二义信息,这是语言大模型的强项。 如何利用该强项, 把自然语言的问询变成一个标准规范的语言描述, 以便于使用告诉准确的nl2sql生成工具;
2、SQL中可能涉及大量领域自定义函数(例如时空数据库),不同函数的定义和参数区别很大,且形式复杂,需要准确识别并在上下文中调用;
3、针对提问中包含的隐含信息,common sense,领域推理逻辑,进行高效准确的转换, 以完成复杂的推理过程;
4、研发仅通过快速配置, 就能生成高准确度SQL语句, 并适配不同数据库引擎SQL语法方言(例如adg-pgmysql语法有区别)。

工作职责


以语言大模型为代表的AI如火如荼,但在NL2SQL这个数据库垂直技术领域, 纯粹依赖大模型存在推理速度慢,生成准确度不稳定等不足。 该研发项目围绕在大模型结合小模型,用小模型在专域上加强大模型的不足作为突破点,将大模型的能力延展到以SQL语法为引导下开发的小模型工具。目标是让NL2SQL能力成为大模型在数据库查询领域的一个专用工具, 做到快速, 准确,高效。
包括英文材料
大模型+
SQL+
MySQL+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 深度学习 项目简介: 随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据; 以下两个关键点需要投入人力研究: 1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度; 2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 随着人工智能技术的快速发展,机器人领域正从传统的工业自动化向智能化、消费级方向转变。桌面机器人作为面向用户的电子消费品,旨在通过视觉、语言和行动(VLA,Vision-Language-Action)的深度融合,实现与人类的自然交互,并完成复杂的任务。这类机器人不仅可以提高用户的生活质量,还能在教育、娱乐、办公等场景中提供智能化服务。

logo of antgroup
实习研究型实习生

研究领域: 其他 项目简介: LLM在多个任务中已经展示了强大的能力。然而,由于现实世界的数据和需求不断变化,模型需要持续学习新知识以保持其性能。如何通过数据合成、数据增强、数据采样等多种方式,使得模型能够获取更好的知识是当前行业研究的重点和难点。以DeepSeek-R1为代表的推理模型范式为行业提供了重要启示,尤其在数学解题、代码生成、科学计算等场景中,大模型需具备从多步骤推理到最终结论生成的完整逻辑链条处理能力。研究发现,模型性能的提升已从单纯依赖参数规模扩展转向对训练数据质量的深度优化。高质量数据的稀缺性及其对模型能力的影响机理,正成为制约大模型向高阶推理跃迁的核心瓶颈。本研究旨在通过“高质量”数据与AI融合,为AIXData产业应用(包括但不限于数据标注、数据生成、CoT数据等)带来应用价值。

logo of antgroup
实习蚂蚁技术研究院长

通过大模型的架构、预训练、继续预训练和模型融合方法等创新,推进大模型在通用智能领域的进展