亚马逊云科技GPT-3在自然环境下的类比思维测试表现超越大学生
• 阅读 0
在美国心理学家的一项测试中,GPT-3语言模型展现出了其类比思维的强大能力,这种能力是人类智力发展过程中经典方法之一。神经网络算法以意想不到的方式证明了自己,在Raven标准渐进矩阵适应测试中,它获得的正确答案数量超过了大学高年级学生。
这种测试不仅是一种娱乐形式,而且可能有着科学上的重要意义。科学家们正在探索人工智能能力极限,并寻找理解人类思维的方法。GPT-3系列算法最令人印象深刻的是它们能够用最少的示例解决某些新问题,这种思维机制被称为类比推理。
加州大学洛杉矶分校(UCLA)的研究人员想要知道GPT-3是否真的能通过类比进行推理。他们选择了模型在训练期间绝对不会遇到的任务。这项研究使用了经过时间考验的Raven标准渐进矩阵,对基于文本的人工智能进行了改编和调整。
结果表明,尽管GPT-3没有多模态模型那样处理视觉信息,但它仍然表现出色。在“仇恨”与“爱”的相似之处,“财富”是什么?(正确答案是“贫穷”),这个问题上,算法必须明白需要找到反义词,而无需直接指示。
然而,就像预期中的那样,空间思维任务成了挑战,即使详细描述一个问题,比如将软糖从一个碗转移到另一个碗的最佳方法,也无法得到有效回答。这项研究提出了一个新的层面的问题:大型语言模型是否模仿了人类思维许多方面,或我们面临一种全新的思维方式?
这项工作存在两个重大局限性,其作者也指出了这一点。一方面,由于训练数据可能包含SAT变体的问题样本,因此不能保证GPT-3未曾接触过这些类型的问题。此外,由于无法进入模型内部,我们对其“思考”过程知之甚少,这限制了解人工智能如何工作以及如何进一步开发神经科学领域的心理学知识。
标签:
白家电