GPT-3在自然环境中展现出的类比思维测试结果超越大学生芯片技术的应用为其提供了强大支持
• 阅读 0
在美国心理学家的一项测试中,GPT-3语言模型展现出了其类比思维的强大能力,这一能力通常被用来评估人类智力的发展。该模型通过Raven标准渐进矩阵适应性测试得到了更高的正确答案率,比大学高年级学生表现更好。科学家们正在利用这种测试方法来探索如何理解和模拟人类思维。
这项研究考察了GPT-3是否能够独立于训练过程中的任务类型之外进行类比推理。为了验证这一点,科学家们将Raven标准渐进矩阵适应性测试卡片调整为文本形式,以便用于基于文本的人工智能。这一系列问题包括九个元素的图像,其中最后一个单元缺失,要求解决者从多个选项中选择正确答案。
结果显示,即使在没有直接指导的情况下,GPT-3也能很好地完成这些任务,并且犯下的错误与人类相同。这表明决策过程可能非常相似。在SAT(美国标准化入学考试)提供的问题上,该模型同样表现出色,但在空间思维任务上却遇到困难。
尽管GPT-3在这些测试中取得了显著成就,但科学家们指出还有两个重大局限性:首先,它不太可能已经见过这样的任务;其次,由于无法进入模型“内部”,我们对它“思考”过程的了解有限。未来的研究将继续探索人工智能如何模仿或超越人类思维,以及我们可以如何更深入地理解它们的工作方式。
标签:
数码电器测评