論文の概要: Decoupling Thought from Speech: Knowledge-Grounded Counterfactual Reasoning for Resilient Multi-Agent Argumentation
- arxiv url: http://arxiv.org/abs/2606.10475v1
- Date: Tue, 09 Jun 2026 06:43:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.356115
- Title: Decoupling Thought from Speech: Knowledge-Grounded Counterfactual Reasoning for Resilient Multi-Agent Argumentation
- Title(参考訳): 音声から思考を分離する: レジリエントなマルチエージェント調合のための知識付き対実推論
- Authors: Jakub Masłowski, Jarosław A. Chudziak,
- Abstract要約: マルチエージェントの議論フレームワークは、収束タスクにおける大きな言語モデルのパフォーマンスを改善することが示されている。
これらのフレームワークは現在、プロセスの安定性よりも最終的な出力精度を強く好んで最適化されている。
本稿では,KG-CFR(Knowledge-Grounded Counterfactual Reasoning)について紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-agent debate frameworks have been shown to improve large language model performance in convergent tasks, but they are currently optimized in a way that heavily favors final output accuracy rather than stability of the process. During long-horizon exchanges reactive systems under sustained perturbations often experience logic degradation, argument repetition, and role drift. To structurally prevent the identity loss and maintain the process fidelity, we introduce Knowledge-Grounded Counterfactual Reasoning (KG-CFR), a dual-stage architecture that enforces a strict separation of concerns between a private, retrieval-augmented planning buffer, and a public execution layer. We assess this system in Dynamic Resource Allocation under Uncertainty (DRAU), a dedicated 1v1v1 environment, introducing diversity as distinct from standard debate settings. Over 270 completely factorial crisis simulation trajectories with stochastic environmental shocks, KG-CFR prevents judge-detected critical post-shock degradation (defined as a quality shift, $Δ\le -0.20$) in more than 95% of perturbed runs, increasing the overall argument quality from 0.694 to 0.822. Our primary contribution is the demonstration of architectural decoupling being an important factor of systemic resilience enhancement under sustained pressure without quality loss. Furthermore, we introduce custom vector metrics for discourse divergence and plan-execution alignment that provide strong, directionally consistent evidence of operational stability. Our ablation experiments suggest that the proper doctrinal grounding can be an equally important factor for argument quality, as the prospective planning. KG-CFR, according to our initial metric evaluations, reduces semantic looping, by preserving the agent's consistency with the original plan.
- Abstract(参考訳): マルチエージェントの議論フレームワークは、収束タスクにおける大きな言語モデルのパフォーマンスを改善することが示されているが、それらは現在、プロセスの安定性よりも最終的な出力精度を強く好んでいる方法で最適化されている。
長期にわたって、持続的な摂動の下での反応系は、しばしば論理的劣化、議論の繰り返し、役割の漂流を経験する。
自己同一性喪失を防止し,プロセスの忠実性を維持するために,私的かつ検索強化された計画バッファと公開実行層との間の懸念を厳格に分離する2段階アーキテクチャであるKG-CFR(KG-Grounded Counterfactual Reasoning)を導入する。
我々は,このシステムを1v1v1専用環境であるDRAU(Dynamic Resource Allocation under Uncertainty)において評価し,標準化された議論環境とは異なる多様性を導入する。
確率的環境ショックを伴う270以上の完全な要因的危機シミュレーションでは、KG-CFRは、95%以上の摂動ランにおいて、判定検出された臨界余震の劣化(品質シフトとして定義される$Δ\le -0.20$)を防止し、全体的な議論品質を0.694から0.822に向上させる。
我々の主な貢献は、品質損失のない持続的な圧力下での系統的なレジリエンス向上の重要な要因であるアーキテクチャの疎結合の実証である。
さらに、談話の発散と計画実行アライメントのためのカスタムベクトルメトリクスを導入し、運用安定性の強い方向整合性を示す。
我々のアブレーション実験は、適切な教義的接地が議論の質にとって同様に重要な要因となりうることを示唆している。
KG-CFRは, エージェントの当初の計画との整合性を維持することにより, セマンティックループを低減する。
関連論文リスト
- Semantic Reward Collapse and the Preservation of Epistemic Integrity in Adaptive AI Systems [0.0]
近年の強化学習の進歩により、大規模言語モデルのユーザビリティ、一貫性、安全性が大幅に向上した。
実行的確実性などの繰り返しの振る舞いは、スカラー化された選好最適化システム内の未解決構造問題を示唆している。
本稿では,SRC(Semantic Reward Collapse)を提案する。
論文 参考訳(メタデータ) (2026-05-12T17:03:26Z) - Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - The Cognitive Penalty: Ablating System 1 and System 2 Reasoning in Edge-Native SLMs for Decentralized Consensus [0.0]
本稿では,Qwen-3.5-9B 上で厳密なモデル内アブレーションを実行する 840-inference 実験フレームワーク Sentinel-Bench を紹介する。
システム1は、100%対逆ロバスト性、100%法線の整合性、および状態の整合性を13秒未満で達成した。
システム2の推論は破滅的な不安定を招き、基本的に26.7%の反響非収束(認知的崩壊)率によって引き起こされた。
論文 参考訳(メタデータ) (2026-04-18T08:46:37Z) - Adaptive Robust Estimator for Multi-Agent Reinforcement Learning [27.595086716369483]
協調推論のための頑健な多エージェント強化学習フレームワークを提案する。
Dual-Agent Answer-Critique-Rewrite (DACR)とAdaptive Robust Estimator (ARE)の2つのコンポーネントで構成されている。
論文 参考訳(メタデータ) (2026-03-23T04:51:15Z) - On the Plasticity and Stability for Post-Training Large Language Models [54.757672540381236]
塑性と安定性勾配の矛盾として根本原因を同定する。
本稿では,確率的衝突解決法(PCR)を提案する。
PCRはトレーニングの軌道を著しく滑らかにし、様々な推論タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-02-06T07:31:26Z) - Logic-Driven Semantic Communication for Resilient Multi-Agent Systems [26.964933264412412]
6Gネットワークは、大規模な分散マルチエージェントシステムにおいて、自律性とインテリジェンスを加速している。
本稿では2つの相補的な次元に根ざしたMASレジリエンスの形式的定義を提案する。
我々はエージェントアーキテクチャを設計し、エピステミックとアクションレジリエンスの両方を達成するために分散アルゴリズムを開発する。
論文 参考訳(メタデータ) (2026-01-11T00:54:09Z) - Robust-R1: Degradation-Aware Reasoning for Robust Visual Understanding [54.05243949024302]
既存の堅牢なMLLMは、視覚エンコーダの一般化にのみ焦点をあてた暗黙のトレーニング/適応に依存している。
本稿では,構造的推論連鎖による視覚的劣化を明示的にモデル化する新しいフレームワークであるRobust-R1を提案する。
提案手法は, (i) 劣化を考慮した推論基盤の微調整, (ii) 劣化パラメータを正確に知覚するための報酬駆動アライメント, (iii) 劣化強度に適応した動的推論深度スケーリングの2つを統合した。
論文 参考訳(メタデータ) (2025-12-19T12:56:17Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。