Key points are not available for this paper at this time.
大規模言語モデルに中間推論ステップの生成を要求することは、性能向上の効果的な手法であることが示されています。実際、これらの中間推論ステップに対する指示チューニングがモデルの性能を改善することがわかっています。本研究では、単一推論ステップで解答を生成する前に複数の推論連鎖を比較させることでさらに性能を向上させる新しい手法を提案します。この手法をDivergent CoT(DCoT)と呼びます。DCoTデータセットに対する指示チューニングが、より小規模でアクセスしやすいLLMの性能向上にも寄与することを確認しました。様々な推論タイプを要する幅広いタスクにわたる厳密な実験により、1.3Bから70Bまでのモデル群と規模において、CoTベースラインを一貫して超える性能向上が見られました。実証的かつ手動の評価を組み合わせて、これらの性能向上は単一の推論ステップで複数の発散的推論連鎖を生成することに由来し、言語モデルにおける自己修正の可能性を示すことを追加的に示しました。コードおよびデータは https://github.com/UKPLab/arxiv2024-divergent-cot で公開しています。
Building similarity graph...
Analyzing shared references across papers
Loading...
Haritz Puerto
Tilek Chubakov
Xiaodan Zhu
Building similarity graph...
Analyzing shared references across papers
Loading...
Puertoら(Wed,)はこの問題を研究しました。
www.synapsesocial.com/papers/68e6191db6db6435875abe72 — DOI: https://doi.org/10.48550/arxiv.2407.03181
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: