logo of tongyi

通义研究型实习生-大语言模型的多语言预训练探索与研究

实习兼职通义研究型实习生地点:北京 | 杭州状态:招聘

任职要求


● 在大模型、多模态、强化学习方向有积累与经验。
● 工作地:杭州、北京。
● 科研能力突出,追踪前沿技术,可基本独立完成研究课题,有一作顶会论文优先。

工作职责


大模型因其强大的语言理解和生成能力,在人工智能领域引起了广泛关注。当前,ChatGPT、LLama等关注英语的大型语言模型已经取得了显著成就。关注中文的大模型,如ChatGLM、MOSS以及千问等也正在快速发展。然而,中/英以外的语言能力关注较少,但需求和研究价值很高。
包括英文材料
大模型+
强化学习+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 【攻击】蚁鉴作为蚁天鉴大模型安全一体化解决方案的重要组成部份之一,聚焦于大语言模型潜在输出内容安全的主动挖掘和模型安全能力的量化评测。随着大模型的应用场景不断扩增,使用场景不断多样化,模态增加,agent组件增加,其暴露出来的潜在风险问题也随之扩大。我们希望通过建立一套自动化选件红队体系,挖掘更多的风险,研发更高攻击成功率的方法。从而更快,更全面地发现风险,评估风险,解决风险。当前评测遇到挑战: 1、如何批量的自动发现扫描未知的安全风险; 2、多模态agent 大模型安全评测方案设计; 3、如何对非API的复杂智能体(例如支小宝)进行评测; 4、大模型其他安全问题的研究,例如:能耗攻击,后门,可解释性等; 【防御】大模型对齐作为蚁天鉴安全护栏核心能力之一,对于不安全或者有攻击性的query,在response的价值观等安全性方面往往能表现出更加优秀的性能,在安全链路中发挥着及其重要的作用。 然而,内容安全大模型依然存在大模型的不足: 1. 与语言模型相比,多模内容安全大模型在内容的理解和生成存在许多跨域风险的理解与对齐问题。 2. 幻觉问题,对于一些低频知识依然存在幻觉,特别是在涉政场景,幻觉问题的影响会被放大。 3. 模型难以可控生成,对于一些紧急badcase修复和业务调整依然需要大量数据重新训练成本较高,无法进行及时高效地局部模型知识更新。 4. 推理模型安全性研究与防控。

logo of tongyi
实习通义研究型实习生

随着人工智能技术的发展,尤其是自然语言处理领域的大语言模型的突破,为企业和个人带来了前所未有的机遇。在这一背景下,大语言模型智能体的应用成为推动业务创新的关键驱动力。 为了进一步推动大语言模型智能体的发展和应用,本项目将聚焦以下几个方面: 1. 增强智能体的多功能性和灵活性:目前,大语言模型智能体已经能够在多个场景中发挥作用,但是其功能性和灵活性仍有待提升。我们希望通过持续的模型训练和微调,使智能体能够更好地理解和响应用户的多样化需求,从而提供更加精准的服务。 2. 工具学习和集成:智能体需要能够学习和利用外部工具来完成特定任务。这包括但不限于数据检索、数据分析、第三方API调用等。我们计划开发一套工具学习框架,使得智能体能够自动识别哪些工具对于完成特定任务最有帮助,并能够有效地调用这些工具。

更新于 2025-02-20
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 大语言模型近年来在自然语言处理领域取得了显著进展,但在处理高难度数学问题和复杂编程任务时,仍面临着推理能力不足和精度不够的问题。数学和代码问题通常涉及深层次的逻辑推理、符号推导和多步骤的推理过程,而这些任务要求模型能够准确地理解并生成符合数学或编程逻辑的解答。本课题旨在研究如何提升大语言模型在高难度数学推理和代码生成方面的能力,尤其是增强其对复杂问题的理解、推理和解决过程。通过创新的技术手段,本课题希望能够推动模型在这些领域的应用和实用性,进一步拓展大语言模型的应用边界。

logo of tongyi
实习通义研究型实习生

随着大语言模型(如ChatGPT等)的广泛应用,各行业对个性化回复的需求日益增长。个性化回复不仅能提升用户体验,还能增强模型在特定领域的实用性和准确性,但个性化回复的实用性和效果仍存在优化空间。本课题旨在探讨如何利用大语言模型实现个性化回复,满足不同行业及用户的特定需求。通过对用户输入上下文和历史对话的深度分析,模型将能够生成更具针对性和相关性的回复,从而提高用户满意度和互动有效性,我们希望在大模型个性化回复的研究中解决以下技术问题: 1. 用户行为数据的挖掘与建模:研究如何有效地收集和分析用户的历史交互记录、偏好设置等信息,以实现更精准的个性化推荐和回复策略。 2. 多轮对话的上下文理解:提高模型在多轮对话中对于上下文信息的理解能力,确保模型能够根据先前的对话内容生成更连贯、相关的回应。 3. 情感分析与情感适应:探索如何利用情感识别技术,使模型能够根据用户的情绪状态调整回复的语气和内容,以提升用户的满意度和对话的自然性。 4. 实时反馈机制:研究如何快速获取用户对模型回复的反馈,并将其融入模型的学习过程中,从而在交互中不断优化个性化表现。 5. 多模态的能力:扩展模型的感知方式,在文本模态的基础上,支持图像、音频等多种模态,从跨模态数据中抽取用户的兴趣,提升用户体验。

更新于 2024-11-04