What type of study is this?

This is a Quantitative Study study.

September 30, 2025Open Access

Pourquoi les LLMs de raisonnement sont des explorateurs errants de solutions

Key Points

Les LLMs de raisonnement échouent souvent à explorer systématiquement l'espace des solutions, ce qui conduit à une résolution de problèmes inefficace.
Une analyse formelle révèle des modes d'échec courants comme des étapes de raisonnement invalides et des conclusions hallucinéennes dans les LLMs.
Plusieurs LLMs à la pointe de la technologie ont été évalués par des analyses qualitatives et quantitatives pour identifier des problèmes persistants.
Améliorer les LLMs de raisonnement pourrait nécessiter de nouvelles métriques centrées sur le processus de raisonnement plutôt que sur les seuls résultats finaux.

Abstract

Les grands modèles de langage (LLMs) ont démontré des capacités de raisonnement impressionnantes grâce à des techniques de calcul au moment du test (TTC) telles que le chain-of-thought prompting et le raisonnement en arbre. Cependant, nous soutenons que les LLMs actuels de raisonnement (RLLMs) manquent de la capacité à explorer systématiquement l'espace des solutions. Cet article formalise ce qui constitue une résolution systématique de problèmes et identifie des modes d'échec courants qui révèlent que les LLMs de raisonnement sont des errants plutôt que des explorateurs systématiques. Par une analyse qualitative et quantitative à travers plusieurs LLMs à la pointe de la technologie, nous découvrons des problèmes persistants : étapes de raisonnement invalides, explorations redondantes, conclusions hallucinéennes ou non fidèles, etc. Nos conclusions suggèrent que la performance des modèles actuels peut sembler compétente sur des tâches simples mais décliner fortement à mesure que la complexité augmente. Sur la base de ces résultats, nous plaidons en faveur de nouveaux indicateurs et outils qui évaluent non seulement les résultats finaux mais aussi la structure même du processus de raisonnement.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jiahao Lu

Ziwei Xu

Mohan Kankanhalli

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Pourquoi les LLMs de raisonnement sont des explorateurs errants de solutions

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider