March 21, 2024Open Access

ChainLM：改良されたチェーン・オブ・ソート思考プロンプトによる大規模言語モデルの強化

Key Points

Key points are not available for this paper at this time.

Abstract

チェーン・オブ・ソート（CoT）プロンプトは、大規模言語モデル（LLM）の推論能力を向上させ、複雑な推論問題を解くための主要な手法として確立されています。既存のCoT生成手法は通常、より単純な推論タスクに焦点を当てているため、低品質で一貫性のないCoTプロンプトにつながっています。この課題に対応するために、我々はCoTプロンプトの実証的調査を行い、より優れたCoTプロンプトを自動生成するための新たなフレームワーク、CoTGeniusを提案します。CoTGeniusは、複雑化、多様化、特化の3つの主な進化戦略と、進化的成功判定および正確性検証の2つのフィルタリング機構に基づいて開発されました。さらに、CoTGeniusを用いて大規模なCoTデータセットを作成し、このデータセットでLlama 2-Chat 7Bおよび13Bモデルをファインチューニングしました。これにより得られたモデルをChainLMと呼びます。推論ステップにおける累積誤差問題に対処するために、複数の議論者が各推論ステップについて議論し正解に到達するステップレベルの討論方式を提案します。多数の実験により、ChainLMモデルが既存モデルと比べて幅広い複雑な推論問題への対応能力を向上させていることを示しました。加えて、CoTGenius内のデータカテゴリがモデル性能に与える影響を詳細に分析しました。データセットとコードは https://github.com/RUCAIBox/ChainLM で公開しています。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Xiaoxue Cheng

Junyi Li

Wayne Xin Zhao

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

ChainLM：改良されたチェーン・オブ・ソート思考プロンプトによる大規模言語モデルの強化

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider