logo of aliyun

阿里云研究型实习生 - 深度融合大模型能力的NL2SQL小模型工具

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


解决如下挑战(发表论文和代码实现):
1、多轮问答,在询问的过程中往往存在多轮下钻问询的过程,以厘清模糊或者二义信息,这是语言大模型的强项。 如何利用该强项, 把自然语言的问询变成一个标准规范的语言描述, 以便于使用告诉准确的nl2sql生成工具;
2、SQL中可能涉及大量领域自定义函数(例如时空数据库),不同函数…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


以语言大模型为代表的AI如火如荼,但在NL2SQL这个数据库垂直技术领域, 纯粹依赖大模型存在推理速度慢,生成准确度不稳定等不足。 该研发项目围绕在大模型结合小模型,用小模型在专域上加强大模型的不足作为突破点,将大模型的能力延展到以SQL语法为引导下开发的小模型工具。目标是让NL2SQL能力成为大模型在数据库查询领域的一个专用工具, 做到快速, 准确,高效。
包括英文材料
大模型+
还有更多 •••
相关职位

logo of antgroup
实习研究型实习生

研究领域: 深度学习 项目简介: 随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据; 以下两个关键点需要投入人力研究: 1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度; 2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;

杭州
logo of amap
实习高德研究型实习生

多模态大模型算法实习生 深度参与亿级用户产品的AI核心能力建设,有机会将研究成果落地于高德,影响亿万用户; 岗位职责 ꔷ 参与多模态表征学习与全模态交互模型的研究与开发,探索文本、图像、语音、地理信息等多源异构数据的深度融合方法; ꔷ 聚焦用户多模态指令理解(如“找附近有露营氛围的咖啡馆”)、商铺及内容的多模态理解(图文、视频、评论、POI属性等),构建面向高德搜索、推荐与智能交互场景的AI Agent能力; ꔷ 设计并实现创新性算法,在真实业务场景中验证效果,提升用户获取信息的有效性、趣味性与沉浸感; ꔷ 推动技术前沿探索,目标在顶会发表高质量学术论文,打造业界领先的多模态AI系统。

更新于 2025-11-21北京
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 随着人工智能技术的快速发展,机器人领域正从传统的工业自动化向智能化、消费级方向转变。桌面机器人作为面向用户的电子消费品,旨在通过视觉、语言和行动(VLA,Vision-Language-Action)的深度融合,实现与人类的自然交互,并完成复杂的任务。这类机器人不仅可以提高用户的生活质量,还能在教育、娱乐、办公等场景中提供智能化服务。

上海
logo of antgroup
实习研究型实习生

研究领域: 其他 项目简介: LLM在多个任务中已经展示了强大的能力。然而,由于现实世界的数据和需求不断变化,模型需要持续学习新知识以保持其性能。如何通过数据合成、数据增强、数据采样等多种方式,使得模型能够获取更好的知识是当前行业研究的重点和难点。以DeepSeek-R1为代表的推理模型范式为行业提供了重要启示,尤其在数学解题、代码生成、科学计算等场景中,大模型需具备从多步骤推理到最终结论生成的完整逻辑链条处理能力。研究发现,模型性能的提升已从单纯依赖参数规模扩展转向对训练数据质量的深度优化。高质量数据的稀缺性及其对模型能力的影响机理,正成为制约大模型向高阶推理跃迁的核心瓶颈。本研究旨在通过“高质量”数据与AI融合,为AIXData产业应用(包括但不限于数据标注、数据生成、CoT数据等)带来应用价值。

北京