論文の概要: Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning
- arxiv url: http://arxiv.org/abs/2604.17433v1
- Date: Sun, 19 Apr 2026 13:26:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.524405
- Title: Self-Consistency from Only Two Samples: CoT-PoT Ensembling for Efficient LLM Reasoning
- Title(参考訳): たった2つの試料からの自己整合性:効率的なLDM推論のためのCoT-PoT実装
- Authors: Raman Saparkhan, Majd Hawasly, Md Rizwan Parvez, Mohammad Raza,
- Abstract要約: 自己整合性(Self-Consistency, SC)は、複数のサンプル出力を集約することにより、大規模言語モデルの推論精度を向上させるための一般的な手法である。
我々は,2つの異なる推論モード(CoT)とProgram-of-Thought(PoT))の相補的強度を利用するハイブリッド・アンサンブル・アプローチを導入する。
また,CoT-PoTのアンサンブルは全体の精度を向上するだけでなく,SCに必要な試料の数を9.3倍に劇的に減少させることを示した。
- 参考スコア(独自算出の注目度): 8.541220267844341
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-consistency (SC) is a popular technique for improving the reasoning accuracy of large language models by aggregating multiple sampled outputs, but it comes at a high computational cost due to extensive sampling. We introduce a hybrid ensembling approach that leverages the complementary strengths of two distinct modes of reasoning: Chain-of-Thought (CoT) and Program-of-Thought (PoT). We describe a general framework for combining these two forms of reasoning in self-consistency, as well as particular strategies for both full sampling and early-stopping. We show that CoT-PoT ensembling not only improves overall accuracy, but also drastically reduces the number of samples required for SC by a factor of 9.3x. In particular, the majority of tasks (78.6%) can be addressed with only two samples, which has not been possible with any prior SC methods.
- Abstract(参考訳): SC(Self-Consistency)は、複数のサンプル出力を集約することで、大規模言語モデルの推論精度を向上させる手法として人気があるが、大規模なサンプリングによって計算コストが高い。
本稿では,2つの異なる推論モード,すなわちChain-of-Thought (CoT) と Program-of-Thought (PoT) の相補的強度を利用するハイブリッドアンサンブル手法を提案する。
本稿では、これらの2種類の推論を自己整合性で組み合わせる一般的な枠組みと、完全なサンプリングとアーリーストッピングの両方のための具体的な戦略について述べる。
また,CoT-PoTのアンサンブルは全体の精度を向上するだけでなく,SCに必要な試料の数を9.3倍に劇的に減少させることを示した。
特に、タスクの大部分(78.6%)は2つのサンプルで対処できるが、以前のSCメソッドでは不可能である。
関連論文リスト
- Truncated Step-Level Sampling with Process Rewards for Retrieval-Augmented Reasoning [32.295907409325615]
強化学習による検索エンジンの推論のための大規模言語モデルの訓練は、信用代行問題によって妨げられる。
2つの相補的なアイデアに基づいて構築されたフレームワークであるSLATEを提案する。
7つのQAベンチマークの実験では、SLATEがスパース・リワードとプロセス・リワードのベースラインを一貫して上回っていることが確認された。
論文 参考訳(メタデータ) (2026-02-26T19:05:40Z) - Breaking the Overscaling Curse: Thinking Parallelism Before Parallel Thinking [14.561556728044918]
システムレベルの評価では、全サンプルに対してグローバル並列度レベルNが割り当てられ、一般的にデータセット全体の精度を最大化するために設定される。
いくつかのサンプルは、より小さなN'Nで同等のパフォーマンスを達成でき、予算の冗長性を引き起こす。
オーバースケーリングの呪いを形式化し定量化し、その普遍性と重大さを実際に示し、トリガー機構を解析する。
論文 参考訳(メタデータ) (2026-01-29T12:22:45Z) - CoT-Saliency: Unified Chain-of-Thought Reasoning for Heterogeneous Saliency Tasks [96.64597365827046]
本稿では,3つの運用上不均一なサリエンシタスクを共同で処理する,最初の統合フレームワークを提案する。
タスクの不均一性を橋渡しする視覚言語モデル(VLM)において、チェーン・オブ・ソート(CoT)推論プロセスを導入する。
我々は,全タスクにまたがる特別なSOTA手法と強力なクローズドソースVLMの整合性を示す。
論文 参考訳(メタデータ) (2025-11-01T04:37:01Z) - Reasoning with Sampling: Your Base Model is Smarter Than You Think [52.639108524651846]
本稿では,基本モデル自身の可能性を利用した単純な反復サンプリングアルゴリズムを提案する。
我々のアルゴリズムは、ほぼ一致し、RLのアルゴリズムよりも優れているという推論において、大幅に向上することを示した。
我々の方法は、トレーニング、キュレートされたデータセット、検証器を必要としない。
論文 参考訳(メタデータ) (2025-10-16T17:18:11Z) - Fractured Chain-of-Thought Reasoning [61.647243580650446]
完全CoTと解のみのサンプリングを補間する統合推論時間戦略であるフラクチャードサンプリングを導入する。
フラクチャードサンプリングは、Pass@kとトークンの予算に対して、急激なログ線形スケーリングゲインをもたらすため、優れた精度とコストのトレードオフを一貫して達成できることを示す。
論文 参考訳(メタデータ) (2025-05-19T11:30:41Z) - Reasoning Aware Self-Consistency: Leveraging Reasoning Paths for Efficient LLM Sampling [9.44858963874474]
自己整合性は、複数の推論経路をサンプリングすることによって、大規模言語モデル(LLM)における幻覚を緩和する。
本稿では、サンプリング効率を高め、忠実性を推論する新しいフレームワークであるReasoning-Aware Self-Consistency (RASC)を紹介する。
論文 参考訳(メタデータ) (2024-08-30T05:14:59Z) - On-Demand Sampling: Learning Optimally from Multiple Distributions [63.20009081099896]
社会と現実世界の考察は、マルチディストリビューション学習パラダイムの台頭につながっている。
これらの学習パラダイムの最適なサンプル複雑性を確立し、このサンプル複雑性を満たすアルゴリズムを提供する。
アルゴリズムの設計と解析は,ゼロサムゲーム解決のためのオンライン学習手法の拡張によって実現されている。
論文 参考訳(メタデータ) (2022-10-22T19:07:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。