March 14, 2024Open Access

有意义的学习：通过通用事实指导提升大型语言模型的抽象推理能力

Key Points

Key points are not available for this paper at this time.

Abstract

大型语言模型（LLMs）在各种推理场景中表现出令人印象深刻的性能和强大的解释能力，标志着向模拟类人智能迈出了重要一步。尽管如此，当面对由通用事实支持的简单问题时，LLMs常常无法给出一致且准确的答案，这表明它们在抽象推理能力上存在不足。这引发了关于LLMs是真正具备推理能力还是仅仅在记忆的激烈讨论。基于此，我们设计了一项初步研究，以量化并深入探讨现有LLMs的抽象推理能力。研究结果显示它们在一般推理与抽象推理表现之间存在显著差异。为解决这一问题，我们制定了一个抽象推理数据集（AbsR）及一个有意义学习范式，旨在教导LLMs如何利用通用事实进行推理。结果表明，我们的方法不仅提升了LLMs的一般推理性能，同时在推动其抽象推理能力方面取得了显著进展，超越了简单的记忆或模仿，实现了对通用事实更为细致的理解和应用。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Kai Xiong

Xiao Ding

Ting Liu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

有意义的学习：通过通用事实指导提升大型语言模型的抽象推理能力

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider