GPT-3类比思维在自然环境下的表现超越了获得6年级一等奖科技手抄报的大学生
• 阅读 0
在美国心理学家的一项测试中,GPT-3语言模型展现出了其类比思维的强大能力,这一能力通常被认为是人类智力的标志。该模型在Raven标准渐进矩阵适应测试中得分远超大学高年级学生。在这个测试中,参与者需要通过观察前两行图形规律,并将其应用于第三行,以找到正确答案。这一任务对人类来说并不困难,但对计算机来说却是一个挑战。
除了Raven矩阵外,研究人员还向GPT-3提供了来自美国标准化入学考试(SAT)的算法任务。这些问题包括找出两个单词之间的关系,比如“仇恨”与“爱”的关系,它们相同的是什么?(正确答案是“贫穷”)。这种类型的问题要求算法理解词义和语境,从而进行类比推理。
尽管GPT-3表现出色,在一些更复杂的问题上也能进行有效的类比思考,但它在空间思维任务上遇到困难。例如,当描述如何从一个碗转移软糖到另一个碗时,即使给出详细说明,算法仍然无法提供有意义的回应。
这项研究提出了一个重要问题:大型语言模型是否模仿了人类思维模式,还是我们面临一种全新的、不可预见的心智方式?如果后者成立,那么我们可能正在经历一种与哲学上的“车里的幽灵”概念相似的现象,其中一个复杂的人工系统似乎获得了新颖且难以预测的心智特性,使之与人类意识几乎无异。
然而,该研究也有局限性。首先,由于训练数据集中的限制,我们不能确定GPT-3是否真正接触过像Raven矩阵这样的任务。此外,由于我们无法进入模型内部,“思考”过程仍然是个未知领域,这阻碍了对神经科学和人工智能心智发展的深入理解。
此项研究发表在《自然人类行为》期刊上,其预印本可供公众免费获取。
标签:
数码电器测评