論文の概要: PRISM: A Principled Framework for Multi-Agent Reasoning via Gain Decomposition
- arxiv url: http://arxiv.org/abs/2602.08586v1
- Date: Mon, 09 Feb 2026 12:24:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.224133
- Title: PRISM: A Principled Framework for Multi-Agent Reasoning via Gain Decomposition
- Title(参考訳): PRISM:ゲイン分解によるマルチエージェント推論のための原則的フレームワーク
- Authors: Yiming Yang, Zhuoyuan Li, Fanxiang Zeng, Hao Fu, Yue Liu,
- Abstract要約: 大規模言語モデル(LLM)の推論能力を高めるための有望なパラダイムとして,マルチエージェントコラボレーションが登場した。
既存のアプローチは、パフォーマンス向上を駆動する原則的なガイダンスや、マルチエージェント推論を体系的に最適化する方法が欠如している。
マルチエージェント推論ゲインを3つの概念的に独立な次元に分解する統合理論フレームワークを導入する。
- 参考スコア(独自算出の注目度): 42.31805270016533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent collaboration has emerged as a promising paradigm for enhancing reasoning capabilities of Large Language Models (LLMs). However, existing approaches remain largely heuristic, lacking principled guidance on what drives performance gains and how to systematically optimize multi-agent reasoning. Specifically, it remains unclear why multi-agent collaboration outperforms single-agent reasoning and which design choices contribute most to these gains, making it difficult to build better systems. We address this gap by introducing a unified theoretical framework that decomposes multi-agent reasoning gains into three conceptually independent dimensions: Exploration for diverse solution coverage, Information for high-fidelity feedback, and Aggregation for principled consensus. Through this lens, existing methods can be understood as special cases that optimize only subsets of these dimensions. Building upon this decomposition, a novel framework called PRISM (Propose-Review-Integrate Synthesis for Multi-agent Reasoning) is proposed, which jointly maximizes all three dimensions through role-based diversity, execution-grounded feedback with evidence-based cross-evaluation, and iterative synthesis with closed-loop validation. Extensive experiments across mathematical reasoning, code generation, and function calling benchmarks demonstrate that PRISM achieves state-of-the-art performance with superior compute-efficiency compared to methods optimizing partial dimensions. The theoretical framework provides actionable design principles for future multi-agent reasoning systems.
- Abstract(参考訳): 大規模言語モデル(LLM)の推論能力を高めるための,有望なパラダイムとして,マルチエージェントコラボレーションが登場した。
しかし、既存のアプローチは概ねヒューリスティックであり、パフォーマンス向上の要因とマルチエージェント推論を体系的に最適化する方法に関する原則的なガイダンスが欠如している。
特に、マルチエージェントのコラボレーションがシングルエージェントの推論より優れている理由や、どの設計選択がこれらの利益に最も寄与するかは、いまだ不明であり、より良いシステムを構築するのが困難である。
このギャップに対処するために、マルチエージェント推論ゲインを3つの概念的に独立した次元に分解する統一的な理論的枠組みを導入する。
このレンズを通して、既存の手法はこれらの次元の部分集合のみを最適化する特別なケースとして理解することができる。
この分解に基づいてPRISM(Propose-Review-Integrate Synthesis for Multi-Adnt Reasoning)と呼ばれる新しいフレームワークが提案されている。
数学的推論、コード生成、関数呼び出しベンチマークの広範な実験により、PRISMは部分次元を最適化する手法と比較して、計算効率の優れた最先端性能を達成することを示した。
理論フレームワークは、将来のマルチエージェント推論システムに対して実行可能な設計原則を提供する。
関連論文リスト
- Group Deliberation Oriented Multi-Agent Conversational Model for Complex Reasoning [0.30586855806896046]
本稿では,複雑な推論タスクにおける単一大言語モデルの制約に対処するため,グループ検討指向のマルチエージェント対話モデルを提案する。
実験の結果,提案モデルではHotpotQAでは16.8%,2WikiMultihopQAでは14.3%,ミーティングバンクでは19.2%の精度でマルチホップ推論精度が向上した。
論文 参考訳(メタデータ) (2025-12-31T04:10:57Z) - Multi-Path Collaborative Reasoning via Reinforcement Learning [54.8518809800168]
CoT(Chain-of-Thought)推論は、LLM(Large Language Models)の問題解決能力を大幅に向上させた。
最近の手法では、連続的な意味空間における推論を可能にするために、ソフトな抽象トークンを生成することでこの問題に対処しようとしている。
提案するM3PO(Multi-Path Perception Policy Optimization)は,推論プロセスに集団的洞察を明示的に注入する,新たな強化学習フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T10:05:46Z) - Maestro: Learning to Collaborate via Conditional Listwise Policy Optimization for Multi-Agent LLMs [23.590034731179824]
我々は、認知モードを構造的に分離するコラボレーションのための原則的パラダイムである、ロールオーケストレーション(Maestro)を提示する。
Maestroは多様な探索のために並列実行エージェントの集合を使用し、収束的で評価的な合成のために特別中央エージェントを使用する。
数学的推論と一般的な問題解決ベンチマークの実験により、マエストロとCLPOは、既存の最先端のマルチエージェントアプローチを一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2025-11-08T21:01:27Z) - Metis-HOME: Hybrid Optimized Mixture-of-Experts for Multimodal Reasoning [16.309345268949745]
マルチモーダルな大推論モデルには 2つの重要な制限があります
単純なクエリでも計算コストのかかる推論を採用する傾向があり、効率の悪さにつながる。
We propose Metis-HOME: a Hybrid Optimized Mixture-of-Experts framework。
論文 参考訳(メタデータ) (2025-10-23T13:02:49Z) - OPTAGENT: Optimizing Multi-Agent LLM Interactions Through Verbal Reinforcement Learning for Enhanced Reasoning [14.105640933123325]
大規模言語モデル(LLM)は、数学的および科学的タスクにおいて顕著な推論能力を示している。
複雑な推論を強化するため、LLMエージェントの集合的知性を活用するためにマルチエージェントシステムが提案されている。
複数エージェントの協調構造を動的に構築・洗練する多エージェント言語強化学習アルゴリズムである$ours$を提案する。
論文 参考訳(メタデータ) (2025-10-20T19:07:51Z) - Benefits and Limitations of Communication in Multi-Agent Reasoning [11.788489289062312]
マルチエージェントシステムの表現性を解析するための理論的枠組みを提案する。
i) タスクを正確に解くために必要なエージェントの数, (ii) エージェント間通信の量と構造, (iii) 達成可能なスピードアップを問題サイズとコンテキストスケールとして導出する。
本研究は,コミュニケーションが有益である状況を特定し,エージェント数と帯域幅のトレードオフを明確化し,いずれのリソースにも制約がある場合の本質的な制約を明らかにする。
論文 参考訳(メタデータ) (2025-10-14T20:04:27Z) - Progressive Multimodal Reasoning via Active Retrieval [64.74746997923967]
多段階多モーダル推論タスクは、大規模言語モデル(MLLM)に重大な課題をもたらす
本稿では,MLLMの推論能力の向上を目的とした汎用フレームワークAR-MCTSを提案する。
我々は,AR-MCTSがサンプリングの多様性と精度を最適化し,信頼性の高いマルチモーダル推論を実現することを示す。
論文 参考訳(メタデータ) (2024-12-19T13:25:39Z) - Unlocking the Capabilities of Thought: A Reasoning Boundary Framework to Quantify and Optimize Chain-of-Thought [61.588465852846646]
大型言語モデル(LLM)の性能向上のための有望なアプローチとして、Chain-of-Thought(CoT)推論が登場した。
本稿では,これらの課題に対処するための新しい推論境界フレームワーク(RBF)を提案する。
論文 参考訳(メタデータ) (2024-10-08T05:26:28Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。