論文の概要: STAR: Failure-Aware Markovian Routing for Multi-Agent Spatiotemporal Reasoning
- arxiv url: http://arxiv.org/abs/2605.10057v2
- Date: Tue, 12 May 2026 04:38:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:07.04837
- Title: STAR: Failure-Aware Markovian Routing for Multi-Agent Spatiotemporal Reasoning
- Title(参考訳): STAR:マルチエージェント時空間推論のためのフェールアウェアマルコフ型ルーティング
- Authors: Ruiyi Yang, Lihuan Li, Hao Xue, Flora D. Salim,
- Abstract要約: 本稿では,現在のエージェント,タスクタイプ,型付き実行状態に対する状態条件付きポリシとして,エージェント間制御を外部化するフェールアウェアルーティングフレームワークSTARを提案する。
障害状態のトレースは異なるため、ルータは不正な出力、依存関係の欠如、ツール-グラウンド抽出-- 計算-デポジットプロトコルに異なる応答をし、中間結果を共有ブラックボードに書き込み、下流融合を行う。
その結果、トレーニング中にトレースが失敗すると、ルーティングポリシのエラー状態のサポートが拡大し、成功のみのトレーニングでは表現できないリカバリ移行が可能になることが証明された。
- 参考スコア(独自算出の注目度): 13.329339723676147
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Compositional spatiotemporal reasoning often requires a system to invoke multiple heterogeneous specialists, such as geometric, temporal, topological, and trajectory agents. A central question is how such a system should route among specialists when execution does not simply succeed or fail, but fails in qualitatively different ways. Existing tool-augmented and multi-agent LLM systems typically leave this routing decision implicit in language generation, making recovery ad hoc, difficult to interpret, and hard to optimize. This paper presents STAR (Spatio-Temporal Agent Router), a failure-aware routing framework that externalizes inter-agent control as a state-conditioned transition policy over the current agent, task type, and typed execution status. At the center of STARis an agent routing matrix that combines expert-specified nominal routes with recovery transitions learned from execution traces. Because the matrix conditions on distinct failure states, the router can respond differently to malformed outputs, missing dependencies, and tool--query mismatches, rather than collapsing them into a generic retry signal. Specialists execute through a tool-grounded extract--compute--deposit protocol and write intermediate results to a shared blackboard for downstream fusion. Results prove that retaining unsuccessful traces during training enlarges the support of the routing policy on error states, enabling recovery transitions that success-only training cannot represent. Across three spatiotemporal benchmarks and eight backbone LLMs, STAR improves over multiple baselines with the clearest gains on queries whose execution deviates from the nominal routing path. Router-specific ablations and recovery analyses further show that typed failure-aware routing, rather than specialist composition alone, is a key factor for these improvements.
- Abstract(参考訳): 構成時空間推論は、幾何学的、時間的、トポロジカル、軌跡的エージェントなど、複数の異種の専門家を呼び出すシステムを必要とすることが多い。
中心的な問題は、そのようなシステムが単に成功したり失敗したりするのではなく、質的に異なる方法で失敗した場合、専門家の間でどのようにルートするべきかである。
既存のツール拡張およびマルチエージェントLLMシステムは、言語生成においてこのルーティング決定を暗黙に残し、リカバリをアドホックにし、解釈が難しく、最適化が難しい。
本稿では,現在のエージェント,タスクタイプ,型付き実行状態に対する状態条件遷移ポリシとして,エージェント間制御を外部化する障害対応ルーティングフレームワークSTAR(Spatio-Temporal Agent Router)を提案する。
STARisの中央には、専門家が特定した名目ルートと、実行トレースから学んだリカバリトランジションを組み合わせたエージェントルーティング行列がある。
異なる障害状態の行列条件のため、ルータは一般的な再試行信号に分解するのではなく、不正な出力、依存関係の欠如、ツールクエリミスマッチに対して異なる応答をすることができる。
専門家はツールグラウンドの抽出--compute--depositプロトコルを通じて実行し、中間結果を共有ブラックボードに書き込み、下流の核融合を行う。
その結果、トレーニング中にトレースが失敗すると、ルーティングポリシのエラー状態のサポートが拡大し、成功のみのトレーニングでは表現できないリカバリ移行が可能になることが証明された。
3つの時空間ベンチマークと8つのバックボーンLDMで、STARは、名前付きルーティングパスから逸脱したクエリに対して、最も明確なゲインで、複数のベースラインを改善する。
ルータ固有のアブリゲーションとリカバリ分析により、これらの改善の鍵となる要因は、専門的な構成ではなく、型付き障害対応ルーティングであることが示された。
関連論文リスト
- CodeTracer: Towards Traceable Agent States [40.51936201889185]
異種実行アーティファクトを解析し,抽出器を進化させるトレースアーキテクチャであるCodeTracerを提案する。
CodeTracerは、永続的なメモリを持つ階層的なトレースツリーとして、完全な状態遷移履歴を再構築する。
障害発生元とその下流チェーンを特定するために、障害オンセットのローカライゼーションを実行する。
論文 参考訳(メタデータ) (2026-04-13T15:52:03Z) - AgentTrace: Causal Graph Tracing for Root Cause Analysis in Deployed Multi-Agent Systems [0.0]
本稿では,デプロイされたマルチエージェントAIシステムにおけるポストホック障害診断のための軽量因果トレースフレームワークであるAgentTraceを紹介する。
AgentTraceは、実行ログから因果グラフを再構築し、エラー発生から後方にトレースし、解釈可能な構造信号と位置信号を使って候補根本原因をランク付けする。
この結果から,因果トレースはエージェントシステムの信頼性と信頼性を向上させるための実践的な基盤となることが示唆された。
論文 参考訳(メタデータ) (2026-03-16T00:46:44Z) - Efficient and Interpretable Multi-Agent LLM Routing via Ant Colony Optimization [58.59491516762626]
マルチエージェントシステム(MAS)のための効率的かつ解釈可能なルーティングフレームワークAMRO-Sを提案する。
AMRO-Sは、意味条件付き経路選択問題としてMASルーティングをモデル化し、3つのキーメカニズムを通してルーティング性能を向上させる。
5つの公開ベンチマークと高速ストレステストによる大規模な実験により、AMRO-Sは強いルーティングベースラインに対する品質-コストトレードオフを一貫して改善することを示した。
論文 参考訳(メタデータ) (2026-03-13T12:26:05Z) - AgentRx: Diagnosing AI Agent Failures from Execution Trajectories [9.61742219198197]
構造化されたAPI、インシデント管理、オープンなWeb/ファイルタスクにまたがる115の障害トラジェクトリのベンチマークをリリースする。
各トラジェクトリには、臨界障害ステップと、基底理論から派生したクロスドメイン障害分類のカテゴリが注釈付けされている。
本稿では,ドメインに依存しない自動診断フレームワークであるAgentRXについて述べる。
論文 参考訳(メタデータ) (2026-02-02T18:54:07Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - Just-in-time Episodic Feedback Hinter: Leveraging Offline Knowledge to Improve LLM Agents Adaptation [77.90555621662345]
JEF Hinterは、オフライントレースをコンパクトでコンテキスト対応のヒントに蒸留するエージェントシステムである。
ズーム機構は、長い軌道における決定的なステップを強調し、戦略と落とし穴の両方をキャプチャする。
MiniWoB++、WorkArena-L1、WebArena-Liteの実験は、JSF Hinterが一貫して強力なベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2025-10-05T21:34:42Z) - Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。