logo of aliyun

阿里云研究型实习生 - 深度融合大模型能力的NL2SQL小模型工具

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


解决如下挑战(发表论文和代码实现):
1、多轮问答,在询问的过程中往往存在多轮下钻问询的过程,以厘清模糊或者二义信息,这是语言大模型的强项。 如何利用该强项, 把自然语言的问询变成一个标准规范的语言描述, 以便于使用告诉准确的nl2sql生成工具;
2、SQL中可能涉及大量领域自定义函数(例如时空数据库),不同函数…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


以语言大模型为代表的AI如火如荼,但在NL2SQL这个数据库垂直技术领域, 纯粹依赖大模型存在推理速度慢,生成准确度不稳定等不足。 该研发项目围绕在大模型结合小模型,用小模型在专域上加强大模型的不足作为突破点,将大模型的能力延展到以SQL语法为引导下开发的小模型工具。目标是让NL2SQL能力成为大模型在数据库查询领域的一个专用工具, 做到快速, 准确,高效。
包括英文材料
大模型+
还有更多 •••
相关职位

logo of antgroup
实习研究型实习生

研究领域: 深度学习 项目简介: 随着基础大模型能力的提升,对模型短板数据/知识型数据的需求越来越大;通过正向挖掘很难补充该分布数据; 以下两个关键点需要投入人力研究: 1、通过智能体工作流来融合多模态大模型的协同与规划能力;提升整体数据链路的任务覆盖广度与深度; 2、通过数据主动合成探索数据闭环实现路径;提升交付自动化程度与质量;

杭州
logo of amap
实习高德研究型实习生

多模态大模型算法实习生 深度参与亿级用户产品的AI核心能力建设,有机会将研究成果落地于高德,影响亿万用户; 岗位职责 ꔷ 参与多模态表征学习与全模态交互模型的研究与开发,探索文本、图像、语音、地理信息等多源异构数据的深度融合方法; ꔷ 聚焦用户多模态指令理解(如“找附近有露营氛围的咖啡馆”)、商铺及内容的多模态理解(图文、视频、评论、POI属性等),构建面向高德搜索、推荐与智能交互场景的AI Agent能力; ꔷ 设计并实现创新性算法,在真实业务场景中验证效果,提升用户获取信息的有效性、趣味性与沉浸感; ꔷ 推动技术前沿探索,目标在顶会发表高质量学术论文,打造业界领先的多模态AI系统。

更新于 2025-11-21北京
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 随着人工智能技术的快速发展,机器人领域正从传统的工业自动化向智能化、消费级方向转变。桌面机器人作为面向用户的电子消费品,旨在通过视觉、语言和行动(VLA,Vision-Language-Action)的深度融合,实现与人类的自然交互,并完成复杂的任务。这类机器人不仅可以提高用户的生活质量,还能在教育、娱乐、办公等场景中提供智能化服务。

上海
logo of tongyi
实习通义研究型实习生

1. 参与设计和实现融合音频理解与生成能力的统一架构,打破传统模型在“理解”与“生成”之间的壁垒; 2. 研究并开发针对长时序音频的高效建模方法,解决上下文保持难题,提升长程语义一致性和事件定位精度; 3. 提升模型在高噪声、低资源、多说话人等复杂环境下的鲁棒性,同时保证生成内容的自然度; 4. 实现跨音频类型的通用表征学习,支持零样本或少样本迁移至新任务或领域; 5. 优化模型推理效率,支持端侧部署与实时交互,满足边缘设备及移动端应用需求。

更新于 2025-12-10北京|杭州