論文の概要: Dynamic Attentional Context Scoping: Agent-Triggered Focus Sessions for Isolated Per-Agent Steering in Multi-Agent LLM Orchestration
- arxiv url: http://arxiv.org/abs/2604.07911v1
- Date: Thu, 09 Apr 2026 07:26:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.765342
- Title: Dynamic Attentional Context Scoping: Agent-Triggered Focus Sessions for Isolated Per-Agent Steering in Multi-Agent LLM Orchestration
- Title(参考訳): ダイナミック・アテンショナル・コンテクスト・スコピング:マルチエージェントLPM手術におけるエージェントトリガー・フォーカス・セッション
- Authors: Nickson Patel,
- Abstract要約: マルチエージェント LLM オーケストレーションシステムは,コンカレントエージェントがオーケストレータのコンテキストウィンドウと競合する場合,コンテキスト汚染に悩まされる。
本研究では,2つの非対称モードでオーケストレータを動作させる機構である動的注意コンテキストスコープ(DACS)を導入する。
DACSは平文ベースラインでは21.0--60.0%に対して90.0-98.4%のステアリング精度を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent LLM orchestration systems suffer from context pollution: when N concurrent agents compete for the orchestrator's context window, each agent's task state, partial outputs, and pending questions contaminate the steering interactions of every other agent, degrading decision quality. We introduce Dynamic Attentional Context Scoping (DACS), a mechanism in which the orchestrator operates in two asymmetric modes. In Registry mode it holds only lightweight per-agent status summaries (<=200 tokens each), remaining responsive to all agents and the user. When an agent emits a SteeringRequest, the orchestrator enters Focus(a_i) mode, injecting the full context of agent a_i while compressing all other agents to their registry entries. Context isolation is agent-triggered, asymmetric, and deterministic: the context window contains exactly F(a_i) + R_{-i} during steering, eliminating cross-agent contamination without requiring context compression or retrieval. We evaluate DACS across four experimental phases totalling 200 trials: Phase 1 tests N in {3,5,10} (60 trials); Phase 2 tests agent heterogeneity and adversarial dependencies (60 trials); Phase 3 tests decision density up to D=15 (40 trials); Phase 4 uses autonomous LLM agents for free-form questions (40 trials, Claude Haiku 4.5). Across all 8 synthetic scenarios, DACS achieves 90.0--98.4% steering accuracy versus 21.0--60.0% for a flat-context baseline (p < 0.0001 throughout), with wrong-agent contamination falling from 28--57% to 0--14% and context efficiency ratios of up to 3.53x. The accuracy advantage grows with N and D; keyword matching is validated by LLM-as-judge across all phases (mean kappa=0.909). DACS outperforms the flat-context baseline by +17.2pp at N=3 (p=0.0023) and +20.4pp at N=5 (p=0.0008) in Phase 4, with the advantage growing with N confirmed by two independent judges.
- Abstract(参考訳): コンカレントエージェントがオーケストレータのコンテキストウィンドウと競合するとき、各エージェントのタスク状態、部分出力、保留中の質問は、他のエージェントのステアリングインタラクションを汚染し、決定品質を低下させる。
本研究では,2つの非対称モードでオーケストレータを動作させる機構である動的注意コンテキストスコープ(DACS)を導入する。
レジストリモードでは、エージェントごとのステータスサマリ(<=200トークン)のみを保持し、すべてのエージェントとユーザに対して応答する。
エージェントがSteeringRequestを出力すると、オーケストレータはFocus(a_i)モードに入り、他のすべてのエージェントをレジストリエントリに圧縮しながらエージェントa_iの全コンテキストを注入する。
コンテキストウィンドウは、ステアリング中に正確にF(a_i) + R_{-i} を含み、コンテキスト圧縮や検索を必要とせず、エージェント間の汚染を取り除く。
3,5,10}(60試験),第2相テスト(60試験),第3相テスト(40試験),第3相テスト(40試験),第4相テスト(40試験),第2相テスト(40試験),第2相テスト(40試験),第3相テスト(40試験),第3相テスト(40試験),第3相テスト(40試験),第3相テスト(40試験),第3相テスト(40試験),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3相テスト(40回),第3次決定(40回),第3次決定(40回),第3次決定(40
8つの合成シナリオ全体で、DACSは90.0--98.4%の操舵精度と21.0--60.0%の平文ベースライン(p < 0.0001全体)を達成し、不正なエージェント汚染は28--57%から0--14%に減少し、文脈効率比は3.53xまで低下した。
精度の優位性は N と D で増大し、キーワードマッチングは全てのフェーズ (平均 kappa=0.909) にわたって LLM-as-judge によって検証される。
DACSは、N=3(p=0.0023)で+17.2pp、N=5(p=0.0008)で+20.4ppで+20.4pp、独立した2人の裁判官によってNで有利に成長する。
関連論文リスト
- ClawArena: Benchmarking AI Agents in Evolving Information Environments [61.664633997138004]
ClawArenaは、進化する情報環境におけるAIエージェントの評価のためのベンチマークである。
それぞれのシナリオは、エージェントをノイズ、部分的、時には矛盾するトレースだけに露呈しながら、完全に隠された地上の真実を維持します。
評価は、マルチソースコンフリクト推論、動的信念修正、暗黙のパーソナライゼーションという3つの複合的な課題に基づいて構成される。
論文 参考訳(メタデータ) (2026-04-05T17:55:23Z) - Agent Q-Mix: Selecting the Right Action for LLM Multi-Agent Systems through Reinforcement Learning [68.85408801740228]
協調型マルチエージェント強化学習問題としてトポロジ選択を再構成する強化学習フレームワークである textbfAgent Q-Mix を提案する。
提案手法は,Qmix値分解を用いて分散化された通信決定を学習し,各エージェントがラウンドワイド通信グラフを共同生成する一連の通信行動から選択する。
エージェントQ-Mixは,エージェント故障に対して優れたトークン効率とロバスト性を示しながら,既存手法と比較して高い平均精度を達成する。
論文 参考訳(メタデータ) (2026-04-01T00:38:24Z) - DiscoUQ: Structured Disagreement Analysis for Uncertainty Quantification in LLM Agent Ensembles [5.647839536820347]
著者間の不一致構造を抽出し活用し,信頼度を良好に推定するフレームワークであるDiscoUQを紹介する。
DiscoUQ-LLM の平均 AUROC は 0.802 であり、最高のベースラインを上回っている。
学習した機能は、ほぼゼロに近いパフォーマンス劣化を伴うベンチマークで一般化される。
論文 参考訳(メタデータ) (2026-03-21T23:24:12Z) - ACAR: Adaptive Complexity Routing for Multi-Model Ensembles with Auditable Decision Traces [3.151184728006369]
本稿では,聴覚条件下でのマルチモデルオーケストレーションのための測定フレームワークACARを提案する。
ACARは、N=3プローブサンプルから計算した自己整合分散(sigma)を使用して、単一モデル、2モデル、3モデル実行モードでタスクをルーティングする。
我々は4つのベンチマークにまたがる1,510のタスクに対してACARを評価し、7,550以上の監査可能な実行を生成した。
論文 参考訳(メタデータ) (2026-02-06T23:27:17Z) - The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。
Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文 参考訳(メタデータ) (2026-01-19T11:45:39Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Multi-Agent LLM Orchestration Achieves Deterministic, High-Quality Decision Support for Incident Response [0.0]
大規模言語モデル(LLM)は、本番システムにおけるインシデント応答を加速することを約束する。
しかし、単一エージェントアプローチは曖昧で使用不能なレコメンデーションを生成する。
コンテナ化されたフレームワークであるMyAntFarm.aiを紹介し、マルチエージェントオーケストレーションがインシデント応答の品質を変えることを示す。
論文 参考訳(メタデータ) (2025-11-19T06:06:11Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。