通义研究型实习生-基于大模型的 Lean 数学语言证明系统
任职要求
1.人工智能相关领域硕士或博士生,对于大模型做过程可保证的数学证明感兴趣; 2.扎实的大模型基础知识,优良的编程风格,熟悉PyTorch等深度学习编程语言,有开发大模型训练算法的经验; 3.优良的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的耐心; 4.具备良好的研究能力和创新能力,比如,在人工智能顶会上以主要作者有论文发表,或者,有一定影响力的arxiv论文或github等。 加分项: 1.熟悉 Lean 语言; 2.有数学竞赛经验。
工作职责
大模型(LLMs)基于自然语言的数学推理无法保证过程准确,本项目主要是基于大模型的Lean语言数学证明系统研究,具体职责包括: 1.基于数学证明题目,开发Lean数据集的构建算法; 2.基于监督微调,强化学习等技术,开发基于LLM的Lean Prover训练测试算法; 3.研究和大模型 Lean Prover相关的前沿技术; 4.撰写论文,技术文档,以及维护代码库。
多模态大模型与推荐系统的结合应用是当前业界前沿的研究方向,旨在通过结合多模态大模型和用户行为数据来提升推荐系统的性能。阿里云人工智能平台(PAI)团队正致力于这一领域的探索与实践,以解决跨场景推荐、冷启动等问题,提高推荐模型在行为数据稀疏场景下的表现。我们的研究和开发方向包括但不限于: 1. 多模态大模型与行为数据的融合:研究多模态大模型(如图像、文本等)与用户行为数据结合的微调训练方法,探索最佳的数据融合策略。 2. 特征对齐:探索新的建模方式,实现多模态特征与用户行为特征之间的对齐,确保模型能够充分利用多种类型的数据提升推荐效果。 3. 推荐模型的优化:在现有推荐模型的基础上,引入多模态特征,优化推荐算法,特别是在冷启动和跨场景推荐等挑战性场景下,提升推荐效果。
自然文本生成是大语言模型在应用落地时最具前景的方向之一,文本摘要、文本扩写和文本润色等能力可以将用户从繁重枯燥的文宇工作中解放出来,显著提高用户的工作效率和行业的生产效率。本项目旨在探索自然文本生成还存在以下若干难题: 1)知识注入的问题:大语言模型需要高质量的数据进行训练,然而现有的通用和行业数据体系的构建相对落后,我们希望通过创新的算法从大量原始的、质量参差不齐的数据中自动挑选高质量数据进行训练,同时通过数据浓度和学习进度的调控平衡大语言模型在各个方向的文本生成能力; 2)知识应用的问题:部分行业如政务、医疗对生成文本的相关度和真实性有很高的要求,然而大语言模型在理解长文本和生成长文本时,存在抓不住重点和生成幻觉的问题; 3)知识评估的问题:文本生成的内容目前仅能依靠人工的方式进行评测,限制了评测的范围和算法迭代的速度。我们希望模型辅助评测的方式,实现半自动乃至全自动的评测。
研究领域: 人工智能 项目简介: 目前行业应用仍主要依赖单模态的数据(如文本或图像)进行风险审核,这种方式无法充分结合不同数据类型信息进行综合决策,导致审核准确率较低,部分复杂审核规则无法实现。尽管已经有一些跨模态审核研究,但在复杂风险审核场景中的应用仍较为初步,研究和实践中存在较多未解决的问题,如跨模态特征融合的有效性、审核规则的动态调整方式等。