論文の概要: GCoT-Decoding: Unlocking Deep Reasoning Paths for Universal Question Answering
- arxiv url: http://arxiv.org/abs/2604.06794v1
- Date: Wed, 08 Apr 2026 08:06:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.41567
- Title: GCoT-Decoding: Unlocking Deep Reasoning Paths for Universal Question Answering
- Title(参考訳): GCoT-Decoding:Universal Question Answeringのためのディープ推論パスをアンロック
- Authors: Guanran Luo, Wentao Qiu, Zhongquan Jian, Meihong Wang, Qingqiang Wu,
- Abstract要約: 連鎖推論は大きな言語モデルを強化することができるが、モデルを導くには手動で設計したプロンプトが必要である。
最近提案された CoT-decoding はプロンプトなしで CoT スタイルの推論経路を生成することができるが、これは固定解集合の問題にのみ適用できる。
本稿では,幅広い質問応答タスクに適用可能な汎用デコーディング戦略GCoTデコーディングを提案する。
- 参考スコア(独自算出の注目度): 12.903751268469698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chain-of-Thought reasoning can enhance large language models, but it requires manually designed prompts to guide the model. Recently proposed CoT-decoding enables the model to generate CoT-style reasoning paths without prompts, but it is only applicable to problems with fixed answer sets. To address this limitation, we propose a general decoding strategy GCoT-decoding that extends applicability to a broader range of question-answering tasks. GCoT-decoding employs a two-stage branching method combining Fibonacci sampling and heuristic error backtracking to generate candidate decoding paths. It then splits each path into a reasoning span and an answer span to accurately compute path confidence, and finally aggregates semantically similar paths to identify a consensus answer, replacing traditional majority voting. We conduct extensive experiments on six datasets covering both fixed and free QA tasks. Our method not only maintains strong performance on fixed QA but also achieves significant improvements on free QA, demonstrating its generality.
- Abstract(参考訳): Chain-of-Thought推論は大きな言語モデルを強化することができるが、モデルをガイドするために手動で設計したプロンプトが必要である。
最近提案された CoT-decoding はプロンプトなしで CoT スタイルの推論経路を生成することができるが、これは固定解集合の問題にのみ適用できる。
この制限に対処するため,幅広い質問応答タスクに適用可能な汎用デコード戦略であるGCoTデコードを提案する。
GCoT復号法は、フィボナッチサンプリングとヒューリスティックな誤り追跡を組み合わせた2段階分岐法を用いて、候補復号経路を生成する。
その後、各パスを推論スパンと回答スパンに分割し、パスの信頼度を正確に計算し、最後に意味的に類似したパスを集約してコンセンサス回答を識別し、従来の過半数投票を置き換える。
固定QAタスクと自由QAタスクの両方をカバーする6つのデータセットに対して、広範な実験を行う。
提案手法は, 固定QAの性能を維持するだけでなく, 自由QAの大幅な改善を実現し, その汎用性を実証する。
関連論文リスト
- LogitsCoder: Towards Efficient Chain-of-Thought Path Search via Logits Preference Decoding for Code Generation [86.08600027874662]
コード生成のための軽量なロジットレベル制御機構を通じて、チェーン・オブ・シント推論を強化する新しいフレームワークであるLogitsCoderを提案する。
我々はLogitsCoderがより効率的で高品質な推論チェーンを生成することを示し、ベースライン方式に比べてコード生成性能が優れていることを示した。
論文 参考訳(メタデータ) (2026-02-15T08:52:19Z) - Think Straight, Stop Smart: Structured Reasoning for Efficient Multi-Hop RAG [24.494759581234803]
TSSS (Think Straight, Stop Smart) は、効率的なマルチホップRAGフレームワークである。
TSSSは (i) 繰り返し発生するプレフィックスをキャッシュし、サブクエリをメインの質問にアンカーするテンプレートベースの推論を導入している。
HotpotQA、2WikiMultiHop、MuSiQueでは、TSSSはRAG-CoTアプローチの最先端の精度と競争効率を達成する。
論文 参考訳(メタデータ) (2025-10-22T02:09:23Z) - Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning [65.20602712957725]
Cacoは、高品質で検証可能な多様な命令-CoT推論データの合成を自動化する新しいフレームワークである。
我々の研究は、人間の介入なしに自己持続的で信頼できる推論システムを構築するためのパラダイムを確立します。
論文 参考訳(メタデータ) (2025-10-05T07:59:24Z) - Fractional Reasoning via Latent Steering Vectors Improves Inference Time Compute [60.151643048803145]
本稿では,推論時の推論強度を連続的に制御するフレームワークであるフラクショナル推論を提案する。
提案手法は, より深い推論を伴う潜在ステアリングベクトルを抽出し, 調整可能なスケーリング係数で再適用することによって機能する。
GSM8K、MATH500、GPQAの実験により、フラクショナル推論は様々な推論タスクやモデルのパフォーマンスを一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-06-18T21:15:59Z) - SQuARE: Sequential Question Answering Reasoning Engine for Enhanced Chain-of-Thought in Large Language Models [4.328173053224842]
本稿では、自己干渉パラダイムによる推論を改善するために設計された新しいプロンプト技術であるSQuAREを紹介する。
CoTフレームワーク上に構築されているSQuAREでは,メインクエリに対処する前に,複数の補助的な質問の生成と解決をモデルに促している。
Llama 3 と GPT-4o モデルを用いて複数の質問応答データセットを用いて評価を行った結果,SQuARE が従来の CoT プロンプトや既存のrephrase-and- corresponding 手法をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2025-02-13T15:07:20Z) - DCR: Divide-and-Conquer Reasoning for Multi-choice Question Answering with LLMs [9.561022942046279]
大規模言語モデル(LLM)の推論能力を高めるため,DCR(Divide and Conquer Reasoning)を提案する。
まず、信頼性スコア(mathcalCS$)に基づいて質問を2つのサブセットに分類する。
特に,質問を信頼性スコア(mathcalCS$)に基づいて2つのサブセットに分類する。
論文 参考訳(メタデータ) (2024-01-10T14:38:46Z) - Modeling Multi-hop Question Answering as Single Sequence Prediction [88.72621430714985]
本稿では,単純な生成手法(PathFid)を提案する。
PathFidは、マルチホップ質問に対する回答を解決するための推論プロセスを明示的にモデル化する。
実験の結果,PathFidは2つのマルチホップQAデータセットに対して高い性能向上をもたらすことが示された。
論文 参考訳(メタデータ) (2022-05-18T21:57:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。