Key points are not available for this paper at this time.
チェーン・オブ・ソート(CoT)プロンプトは、大規模言語モデル(LLM)の推論能力を向上させ、複雑な推論問題を解くための主要な手法として確立されています。既存のCoT生成手法は通常、より単純な推論タスクに焦点を当てているため、低品質で一貫性のないCoTプロンプトにつながっています。この課題に対応するために、我々はCoTプロンプトの実証的調査を行い、より優れたCoTプロンプトを自動生成するための新たなフレームワーク、CoTGeniusを提案します。CoTGeniusは、複雑化、多様化、特化の3つの主な進化戦略と、進化的成功判定および正確性検証の2つのフィルタリング機構に基づいて開発されました。さらに、CoTGeniusを用いて大規模なCoTデータセットを作成し、このデータセットでLlama 2-Chat 7Bおよび13Bモデルをファインチューニングしました。これにより得られたモデルをChainLMと呼びます。推論ステップにおける累積誤差問題に対処するために、複数の議論者が各推論ステップについて議論し正解に到達するステップレベルの討論方式を提案します。多数の実験により、ChainLMモデルが既存モデルと比べて幅広い複雑な推論問題への対応能力を向上させていることを示しました。加えて、CoTGenius内のデータカテゴリがモデル性能に与える影響を詳細に分析しました。データセットとコードは https://github.com/RUCAIBox/ChainLM で公開しています。
Building similarity graph...
Analyzing shared references across papers
Loading...
Xiaoxue Cheng
Junyi Li
Wayne Xin Zhao
Building similarity graph...
Analyzing shared references across papers
Loading...
Chengら(Thu,)がこの問題を研究しました。
www.synapsesocial.com/papers/68e7309eb6db6435876aa7cc — DOI: https://doi.org/10.48550/arxiv.2403.14312
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: