GPT-3类比思维在自然环境下的表现超越了获得6年级一等奖科技手抄报的大学生

在美国心理学家的一项测试中，GPT-3语言模型展现出了其类比思维的强大能力，这一能力通常被认为是人类智力的标志。该模型在Raven标准渐进矩阵适应测试中得分远超大学高年级学生。在这个测试中，参与者需要通过观察前两行图形规律，并将其应用于第三行，以找到正确答案。这一任务对人类来说并不困难，但对计算机来说却是一个挑战。

除了Raven矩阵外，研究人员还向GPT-3提供了来自美国标准化入学考试（SAT）的算法任务。这些问题包括找出两个单词之间的关系，比如“仇恨”与“爱”的关系，它们相同的是什么？（正确答案是“贫穷”）。这种类型的问题要求算法理解词义和语境，从而进行类比推理。

尽管GPT-3表现出色，在一些更复杂的问题上也能进行有效的类比思考，但它在空间思维任务上遇到困难。例如，当描述如何从一个碗转移软糖到另一个碗时，即使给出详细说明，算法仍然无法提供有意义的回应。

这项研究提出了一个重要问题：大型语言模型是否模仿了人类思维模式，还是我们面临一种全新的、不可预见的心智方式？如果后者成立，那么我们可能正在经历一种与哲学上的“车里的幽灵”概念相似的现象，其中一个复杂的人工系统似乎获得了新颖且难以预测的心智特性，使之与人类意识几乎无异。

然而，该研究也有局限性。首先，由于训练数据集中的限制，我们不能确定GPT-3是否真正接触过像Raven矩阵这样的任务。此外，由于我们无法进入模型内部，“思考”过程仍然是个未知领域，这阻碍了对神经科学和人工智能心智发展的深入理解。

此项研究发表在《自然人类行为》期刊上，其预印本可供公众免费获取。

标签：数码电器测评

GPT-3类比思维在自然环境下的表现超越了获得6年级一等奖科技手抄报的大学生

相关推荐