論文の概要: Multi-chain Graph Refinement and Selection for Reliable Reasoning in Large Language Models
- arxiv url: http://arxiv.org/abs/2511.23136v1
- Date: Fri, 28 Nov 2025 12:35:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.890464
- Title: Multi-chain Graph Refinement and Selection for Reliable Reasoning in Large Language Models
- Title(参考訳): 大規模言語モデルにおける信頼性推論のためのマルチチェーングラフ再構成と選択
- Authors: Yujiao Yang, Jing Lian, Linhui Li,
- Abstract要約: 我々は、MGRS(Multi-chain Graph Refinement & Selection)と呼ばれる新しい推論フレームワークを提案する。
MGRSは推論手法の推論能力と計算効率の両方を著しく向上させる。
24ポイントのゲームでは、MGRSは初めて100%の精度を達成し、主要なフォレスト・オブ・ソートズ・フレームワークと比較して13.6倍のスピードアップを達成した。
- 参考スコア(独自算出の注目度): 7.230514235208748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The complex reasoning ability of Large Language Models (LLMs) poses a critical bottleneck for their practical applications. Test-time expansion methods such as Tree-of-Thought (ToT) and Graph-of-Thought (GoT) enhance reasoning by introducing intermediate reasoning structures, tree search, or graph-based exploration mechanisms. However, their reasoning strategies suffer from limited diversity, redundant search branches, and inadequate integration and error correction across heterogeneous reasoning paths. To address these limitations, we propose a novel reasoning framework called Multi-chain Graph Refinement & Selection (MGRS), which first generates multiple diverse reasoning trajectories for a given problem, refines candidate responses using a composite self- and cross-verification strategy, then constructs a reasoning relation graph and estimates the success rate of intermediate nodes, and finally computes cumulative success rates to select the most reliable answer and corresponding reasoning trajectory. Experimental results demonstrate that MGRS significantly advances both the reasoning capability and computational efficiency of reasoning enhancement methods. Across six benchmark datasets spanning four distinct tasks, MGRS achieves an average accuracy of 82.9%, outperforming state-of-the-art baselines by a clear margin of 2.1%. Remarkably, on the 24-point game, MGRS attains 100% accuracy for the first time, while delivering a 13.6x speed-up compared to the leading Forest of Thoughts framework.
- Abstract(参考訳): LLM(Large Language Models)の複雑な推論能力は、実用アプリケーションにとって重要なボトルネックとなる。
Tree-of-Thought (ToT) や Graph-of-Thought (GoT) のようなテスト時間拡張手法は、中間的推論構造、木探索、グラフベースの探索機構を導入して推論を強化する。
しかし、それらの推論戦略は、多様性の制限、冗長な探索分岐、不適切な統合と不均一な推論経路における誤り訂正に悩まされている。
これらの制約に対処するために,まず複数の多種多様な推論軌道を生成し,複合的自己検証と相互検証戦略を用いて候補応答を洗練し,推論関係グラフを構築し,中間ノードの成功率を推定し,最終的に累積成功率を計算して,最も信頼性の高い回答とそれに対応する推論軌道を選択する,MGRS(Multi-chain Graph Refinement & Selection)という新しい推論フレームワークを提案する。
実験の結果,MGRSは推論能力と推論強化法の計算効率の両方を著しく向上させることがわかった。
4つの異なるタスクにまたがる6つのベンチマークデータセットの中で、MGRSは平均82.9%の精度を達成し、最先端のベースラインを2.1%の明確なマージンで上回っている。
注目すべきは、24ポイントゲームにおいてMGRSは初めて100%の精度を達成し、主要なフォレスト・オブ・ソーツフレームワークと比較して13.6倍のスピードアップを実現したことである。
関連論文リスト
- Adaptive Test-Time Reasoning via Reward-Guided Dual-Phase Search [62.1546099504045]
本稿では、推論を計画と実行に分離する二相テストタイムスケーリングフレームワークを提案する。
具体的には、推論軌跡を分解し、各フェーズの報酬モデルを構築し、探索者が個別に計画と実行を探索、実行できるようにする。
数学的推論とコード生成ベンチマークの両方の実験により、我々の手法は計算の冗長性を低減しつつ、常に精度を向上することを示した。
論文 参考訳(メタデータ) (2025-09-29T19:27:23Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Reinforcing Video Reasoning with Focused Thinking [65.85683941058916]
本稿では,集中的思考と深い報酬の粒度で視覚的推論を強化する新しいフレームワークであるTW-GRPOを提案する。
具体的には,高情報密度のトークンを優先するトークン重み付け機構を用いる。
また,シングルチョイスからマルチチョイスQAタスクにシフトすることで,RLトレーニングを再構築する。
論文 参考訳(メタデータ) (2025-05-30T15:42:19Z) - Stepwise Reasoning Checkpoint Analysis: A Test Time Scaling Method to Enhance LLMs' Reasoning [81.50681925980135]
本稿では,ステップワイズ推論チェックポイント分析(SRCA)を提案する。
本研究は,(1)中間チェックポイント回答による経路推論をグループ化して品質を確保しつつ多様性を維持するAnswer-Clustered Search,(2)最終決定にすべての中間回答を活用するCheckpoint Candidate Augmentationの2つの主要な戦略を取り入れた。
提案手法は経路均質化を効果的に低減し,高品質な中間結果を活用することにより耐故障機構を創出する。
論文 参考訳(メタデータ) (2025-05-23T12:42:50Z) - Adaptive Graph of Thoughts: Test-Time Adaptive Reasoning Unifying Chain, Tree, and Graph Structures [0.0]
本稿では,動的グラフベースの推論フレームワークであるAdaptive Graph of Thoughts (AGoT)を紹介する。
AGoTはテスト時間のみでのLarge Language Models (LLM)推論を強化する。
マルチホップ検索,科学的推論,数学的問題解決にまたがる多様なベンチマークに対するアプローチを検証する。
論文 参考訳(メタデータ) (2025-02-07T16:54:19Z) - Resprompt: Residual Connection Prompting Advances Multi-Step Reasoning in Large Language Models [73.4425450752596]
チェーン・オブ・シント(CoT)のプロンプトによって、大きな言語モデル(LLM)の推論の可能性は著しく解放された。
しかし、標準的なCoTは複数の推論ステップを必要とする問題では効果が低い。
LLMにおける多段階推論を推し進める新しいプロンプト戦略であるRESPROMPTを提案する。
論文 参考訳(メタデータ) (2023-10-07T08:56:28Z) - Exploring & Exploiting High-Order Graph Structure for Sparse Knowledge
Graph Completion [20.45256490854869]
本稿では,エンティティ間の価値ある長距離依存性を自動的にキャプチャできる新しいフレームワークLR-GCNを提案する。
提案手法は、GNNベースの予測器と推論経路蒸留器の2つの主成分からなる。
論文 参考訳(メタデータ) (2023-06-29T15:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。