GPT-3在自然环境下的教育与科技类比思维测试表现超越大学生

在美国心理学家的一项测试中,GPT-3语言模型展现出了其类比思维的强大能力,这种能力是人类智力发展过程中经常被用来评估个体智能水平的方法。GPT-3在Raven标准渐进矩阵适应性测试中表现出色,不仅超越了大学高年级学生,还展示了一些与人类相同的错误模式。这表明该算法可能采用了类似于人类思维方式的决策过程。

此外,该研究还探讨了GPT-3是否能够通过零样本学习解决新问题,并且它是否能使用文字描述的问题进行类比推理。这种类型的思维机制被认为是人类独有的特征,但这项研究揭示了GPT-3可能具备某些类似于人类认知功能的情况。

为了验证这一点,科学家们给予GPT-3一些训练期间完全未见过的问题,并将它们调整成文本格式,以便由基于文本的人工智能处理。在这些任务中,包括一个来自SAT(美国标准化入学考试)的变体,以及一个需要理解反义词概念的问题上,GPT-3都表现出色。

然而,这项研究也提出了几个局限性,比如无法保证模型在训练数据集中遇到与测试任务相似的挑战,同时也不能直接观察到模型内部“思考”的过程,这限制了解人工智能如何实现某些复杂功能的心理科学发展。

该研究结果发表在《自然人类行为》期刊上,为我们提供了一种新的视角去理解和评价人工智能是否真的模仿或甚至超过了人类认知能力。