July 2, 2024Open Access

大規模言語モデルにおける推論：幾何学的視点

Key Points

Key points are not available for this paper at this time.

Abstract

実世界アプリケーション向けの大規模言語モデル（LLM）の進展は、その推論能力の向上に大きく依存しています。本研究では、大規模言語モデル（LLM）の推論能力を幾何学的理解を通じて探究します。LLMの表現力と自己注意グラフの密度との関連を確立しました。分析の結果、これらのグラフの密度がMLPブロックの入力の内在次元を定義することを示します。理論分析と簡単な例を通じて、より高い内在次元がLLMのより大きな表現力を意味することを示します。さらに、この幾何学的枠組みとLLMの推論能力強化を目的とした最新の手法の進展との関連性を実証的に示します。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Cosentinoら（Tue,）がこの問題を研究しました。

www.synapsesocial.com/papers/68e61b7fb6db6435875ae5cc — DOI: https://doi.org/10.48550/arxiv.2407.02678

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Extending Token Computation for LLM Reasoning· 2024 · 1 citations
Reasoning in Large Language Models: A Survey· 2025
Toward Efficient and Faithful Reasoning in Large Language Models· 2025
Can Large Language Models Reason? A Characterization via 3-SAT· 2024 · 1 citations
Large Language and Reasoning Models are Shallow Disjunctive Reasoners· 2025 · 1 citations

Authors

Romain Cosentino

Sarath Shekkizhar

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

大規模言語モデルにおける推論：幾何学的視点

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion