論文の概要: Game-Theoretic Multi-Agent Control for Robust Contextual Reasoning in LLMs
- arxiv url: http://arxiv.org/abs/2606.10322v2
- Date: Fri, 12 Jun 2026 14:11:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 13:53:03.489559
- Title: Game-Theoretic Multi-Agent Control for Robust Contextual Reasoning in LLMs
- Title(参考訳): LLMにおけるロバスト文脈推論のためのゲーム理論的マルチエージェント制御
- Authors: Saeid Jamshidi, Amin Nikanjam, Arghavan Moradi Dakhel, Kawser Wazed Nafi, Foutse Khomh,
- Abstract要約: マルチターンインタラクションにおける大規模言語モデル(LLM)は、独立した応答を生成するのではなく、進化するコンテキストを維持している。
GT-MCP(Game-Theoretic Secure Model Context Protocol)は,コンテキスト管理を閉ループ動的プロセスとして扱うコントローラ駆動型マルチエージェント手法である。
不安定性が検出されると、ロールバックベースの自己修復機構が検証済みのコンテキストを復元し、不要なフラグメントの伝播を防止する。
- 参考スコア(独自算出の注目度): 6.335875360476155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) in multi-turn interactions maintain evolving context rather than generating isolated responses, making them vulnerable to prompt-injection and context-poisoning attacks in which locally plausible adversarial fragments gradually distort reasoning trajectories. Existing defenses mainly filter individual outputs and often ignore context evolution across turns, leaving long-horizon reasoning exposed. Although the Model Context Protocol (MCP) standardizes context exchange and tool invocation, it functions as a passive routing layer and does not enforce contextual stability. To address these limitations, we introduce the Game-Theoretic Secure Model Context Protocol (GT-MCP), a controller-driven multi-agent method that treats context management as a closed-loop dynamical process. GT-MCP coordinates three heterogeneous LLM agents and selects outputs through a trust function that jointly evaluates causal consistency against a validated context graph, semantic agreement among agents, and distributional drift over time. When instability is detected, a rollback-based self-healing mechanism restores the validated context and prevents unsupported fragments from propagating. Empirical evaluation over 500 interaction turns under an adaptive adversarial threat model shows that contextual drift remains bounded in 99.6% of turns, with recovery required in only 0.4%. Per-turn utility remains tightly concentrated, with median = -0.19, P05 = -0.72, and P95 = 0.30; severe degradation below -1 occurs in only 0.4% of cases, and no injection attempt succeeds at the controller level. Selected outputs maintain stable win rates above 98%, and computational overhead remains predictable, with latency per token = 1.63e-3 s.
- Abstract(参考訳): マルチターン相互作用における大規模言語モデル(LLM)は、孤立した応答を生成するのではなく、進化するコンテキストを維持しており、局所的に妥当な逆数フラグメントが徐々に推論軌道を歪めてしまうような、迅速なインジェクションやコンテキストポゾン攻撃に対して脆弱である。
既存の防御は主に個々の出力をフィルタリングし、旋回するコンテキストの進化を無視し、長い水平の推論が露呈する。
Model Context Protocol(MCP)はコンテキスト交換とツールの実行を標準化しているが、受動的ルーティング層として機能し、コンテキスト安定性を強制しない。
これらの制約に対処するため,ゲーム理論セキュアモデルコンテキストプロトコル(GT-MCP)を導入し,コンテキスト管理を閉ループ動的プロセスとして扱うコントローラ駆動型マルチエージェント手法を提案する。
GT-MCPは3つの異種LLMエージェントを協調し、検証されたコンテキストグラフに対する因果一貫性、エージェント間のセマンティックアライアンス、時間とともに分布のドリフトを共同評価する信頼関数を通じて出力を選択する。
不安定性が検出されると、ロールバックベースの自己修復機構が検証済みのコンテキストを復元し、不要なフラグメントの伝播を防止する。
500の相互作用に対する実証的な評価は、適応的な敵の脅威モデルの下で、コンテキストドリフトが99.6%のターンで制限され、回復に必要な時間はわずか0.4%であることを示している。
中央値 = -0.19, P05 = -0.72, P95 = 0.30 であり、-1 以下の深刻な劣化はわずか 0.4% のケースで発生し、コントローラレベルでは注入の試みは成功しない。
選択された出力は98%以上の安定な勝利率を維持し、計算オーバーヘッドは予測可能であり、トークンあたりのレイテンシは1.63e-3秒である。
関連論文リスト
- ContextShift: A Controlled Benchmark for Context Dependence in Object Detection [1.8320252176005443]
我々は、オブジェクトの外観を保ちながら、オブジェクト-コンテキスト関係を操作するベンチマークであるContextShiftを紹介する。
偽陰性は227%まで増加し,予測量は44%まで減少する。
拡張されたすべての変種は、オリジナルの画像と操作されたテストイメージの両方でデータセットのみのベースラインよりも優れています。
論文 参考訳(メタデータ) (2026-06-08T13:48:16Z) - Beyond the Attention Stability Boundary: Agentic Self-Synthesizing Reasoning Protocols [6.357772907811544]
SSRP(Self- Synthesizing Reasoning Protocols)は、アーキテクチャ計画と手続き実行の分離を実装するメタ認知フレームワークである。
提案する実験層は,浅電流に基づく検索パイロット,高エントロピーSOP,セマンティックハイジャック3ホップ多要素合成タスクの3種類である。
以上の結果から,GPT 5.4の非定常バニラ基準線が0.1%に崩壊し,SSRPは715X耐力限界を達成した。
論文 参考訳(メタデータ) (2026-04-27T14:13:30Z) - Cognitive Friction: A Decision-Theoretic Framework for Bounded Deliberation in Tool-Using Agents [0.0]
制約のないツール使用エージェントは、どの情報ソースをクエリして実行するかを決めなければなりません。
本稿では,これらの障害モードを認知的摩擦によって形式化する決定論的枠組みであるTCAを提案する。
我々は,TCAを2つの制御された環境において,停止品質,混雑時の行動選択,時間的緊急性の分離を図った。
論文 参考訳(メタデータ) (2026-03-31T17:30:25Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Improving Search Agent with One Line of Code [68.58667107354253]
ツールベースのエージェント強化学習(TARL)は,検索エージェントが外部ツールと対話できるようにトレーニングするための,有望なパラダイムとして登場した。
textbfSearch textbfAgent textbfPolicy textbfOptimization (textbfSAPO)を提案する。
論文 参考訳(メタデータ) (2026-03-10T04:07:39Z) - Adversarial Intent is a Latent Variable: Stateful Trust Inference for Securing Multimodal Agentic RAG [5.4716896485317195]
マルチモーダルエージェントRAGに対する現在のステートレスディフェンスは、悪意のあるセマンティクスを配布する敵の戦略を検出するのに失敗する。
MMA-RAGTは,MTA (Modular Trust Agent) が管理する推定時制御フレームワークで,ほぼ信頼状態を維持している。
論文 参考訳(メタデータ) (2026-02-24T23:52:27Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Internalizing LLM Reasoning via Discovery and Replay of Latent Actions [4.830503861275364]
連鎖プロセスの隠れ状態への内部化は、テスト時間計算をスケールするための非常に効率的なパラダイムとして現れている。
動的潜在軌道制御問題として推論強化を再構築するSTIR(Self-Distilled Tools for Internal Reasoning)を提案する。
論文 参考訳(メタデータ) (2026-02-04T08:44:57Z) - VIRO: Robust and Efficient Neuro-Symbolic Reasoning with Verification for Referring Expression Comprehension [51.76841625486355]
Referring Expression (REC) は、自然言語クエリに対応する画像領域をローカライズすることを目的としている。
最近のニューロシンボリックRECアプローチは、大規模言語モデル(LLM)と視覚言語モデル(VLM)を利用して構成推論を行う。
推論ステップ内に軽量な演算子レベルの検証器を組み込む,ニューロシンボリックなフレームワークであるVIROを紹介する。
論文 参考訳(メタデータ) (2026-01-19T07:21:19Z) - Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.69551510148673]
コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文 参考訳(メタデータ) (2025-10-09T04:48:49Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。