科技发展下的类比思维GPT-3超越大学生自然界启示

在美国心理学家的一项测试中,GPT-3语言模型展现出了其类比思维的强大能力,这种能力是人类智力发展过程中经常被用来评估个体智能水平的方法。GPT-3以意想不到的方式通过了Raven标准渐进矩阵适应测试,在这个测试中,它甚至超过了大学高年级学生。

此外,科学家们还利用开放源代码的ChatGPT等语言模型,让神经网络进行一些原本没有预期做的事情,这种娱乐活动不仅为互联网用户提供了乐趣,而且也可能有着深刻的科学意义。研究人员正在探索人工智能能力极限,并寻找理解人类思维方式的方法。

GPT-3系列算法最令人印象深刻的是它们能够在零样本情况下解决某些新问题,只要通过文字描述问题即可。这一机制,被称为类比推理,是指“推理”作为一种思维过程,而非简单地表达语言形式。这种类型的人类独特特征,也许还存在于一些智力非常发达的动物物种中。

加州大学洛杉矶分校(UCLA)的研究人员想要知道GPT-3是否真的能够通过类比进行推理,因此他们选择了一组在该模型训练期间绝对不会遇到的任务。

为了测试这一点,他们将经过时间考验的Raven标准渐进矩阵改编成基于文本的人工智能可以处理的问题。在这些问题示例中,一系列九个元素构成了三组图像,但第九个单元缺失。要求受试者从多个选项中选择正确答案,其中形状具有多个属性,每一行根据一组规则发生变化。要正确回答,您需要查看前两行,确定规则,并在进行类比后将其应用到第三行。这使得问题既难以用语言描述又容易被视觉感知(见图)。随着每一个任务难度都会增加。

由于GPT-3不是多模态模型,即它只能处理文本,因此矩阵已进行调整,但原理保持不变。此外,还包括来自美国标准化入学考试(SAT)的算法任务,其中大部分变体从未在公共领域发布过,因此 GPT-3 很可能也不熟悉它们。

除了Raven矩阵之外,该模型还能很好地解决更困难的问题,如找到与给定词汇相反义词的情况。但是,当面临空间思维任务时,该模型表现出色,比如详细描述如何将软糖从一个碗转移到另一个碗,最好的方法是什么——使用管子、剪刀还是胶带?尽管如此,算法仍然无法提供任何有意义的情报作为回应。

最后,本次研究提出了一个重要的问题:大型语言模型是否模仿了人类思维许多方面,或者我们面临的是一种全新的思考方式?如果这是后者,那么这种新的思考方式就像是哲学中的著名概念“车里的幽灵”,即一个复杂的人工系统可以获得不可预见、新奇且与人类意识无法区分的地位和功能。在这篇文章结束时,我们注意到这项工作虽然取得了重大突破,但也有两个显著局限性:首先,我们不能保证该模式曾经遇到过与上述类似的任务;其次,由于我们无法进入该模式内部,“思考”过程是一个黑箱子,这限制了解人工智能工作原理并促进神经科学发展。本次研究结果已经发表于《自然人类行为》杂志,其预印本版本可免费获取于arXiv门户网站上。

标签: 白家电
站长统计