論文の概要: Interpretable Failure Analysis in Multi-Agent Reinforcement Learning Systems
- arxiv url: http://arxiv.org/abs/2602.08104v1
- Date: Sun, 08 Feb 2026 19:55:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.982806
- Title: Interpretable Failure Analysis in Multi-Agent Reinforcement Learning Systems
- Title(参考訳): マルチエージェント強化学習システムにおける解釈可能な故障解析
- Authors: Risal Shahriar Shefin, Debashis Gupta, Thai Le, Sarra Alqahtani,
- Abstract要約: MARL(Multi-Agent Reinforcement Learning)は、安全上重要な領域にますます導入されている。
本稿では,3つの臨界故障解析タスクの解釈可能な診断を行うための2段階の勾配に基づくフレームワークを提案する。
- 参考スコア(独自算出の注目度): 8.723131512052703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-Agent Reinforcement Learning (MARL) is increasingly deployed in safety-critical domains, yet methods for interpretable failure detection and attribution remain underdeveloped. We introduce a two-stage gradient-based framework that provides interpretable diagnostics for three critical failure analysis tasks: (1) detecting the true initial failure source (Patient-0); (2) validating why non-attacked agents may be flagged first due to domino effects; and (3) tracing how failures propagate through learned coordination pathways. Stage 1 performs interpretable per-agent failure detection via Taylor-remainder analysis of policy-gradient costs, declaring an initial Patient-0 candidate at the first threshold crossing. Stage 2 provides validation through geometric analysis of critic derivatives-first-order sensitivity and directional second-order curvature aggregated over causal windows to construct interpretable contagion graphs. This approach explains "downstream-first" detection anomalies by revealing pathways that amplify upstream deviations. Evaluated across 500 episodes in Simple Spread (3 and 5 agents) and 100 episodes in StarCraft II using MADDPG and HATRPO, our method achieves 88.2-99.4% Patient-0 detection accuracy while providing interpretable geometric evidence for detection decisions. By moving beyond black-box detection to interpretable gradient-level forensics, this framework offers practical tools for diagnosing cascading failures in safety-critical MARL systems.
- Abstract(参考訳): MARL(Multi-Agent Reinforcement Learning、マルチエージェント強化学習)は、安全クリティカルドメインにますます導入されているが、障害検出と属性の解釈方法はまだ未開発である。
1)真の初期故障源を検出すること(Patient-0)、(2)ドミノ効果により攻撃を受けないエージェントが最初にフラグ付けされる理由を検証すること、(3)学習された調整経路を通じて障害がどのように伝播するかの追跡を行う。
ステージ1は、Taylor-Remainder分析による、ポリシー段階のコストの解釈可能なエージェントごとの障害検出を行い、最初のしきい値交差において、最初のPatent-0候補を宣言する。
ステージ2は、解釈可能な感染グラフを構築するために、批判微分の1次感度と2次方向の曲率の幾何学的解析を通じて検証を行う。
このアプローチでは、上流偏差を増幅する経路を明らかにすることによって、"下流優先"検出異常を説明する。
MADDPGとHATRPOを用いたStarCraft IIでは,500回中3回と5回で評価され,88.2-99.4%の患者-0検出精度が得られた。
このフレームワークは、ブラックボックス検出から解釈可能な勾配レベルの法医学に移行することで、安全クリティカルなMARLシステムのカスケード障害を診断するための実用的なツールを提供する。
関連論文リスト
- VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。
セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。
平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文 参考訳(メタデータ) (2025-09-15T02:25:38Z) - UGPL: Uncertainty-Guided Progressive Learning for Evidence-Based Classification in Computed Tomography [0.0]
現在のアプローチでは、画像が一様に処理され、局所的な異常を検出する能力が制限される。
グローバル-ローカル分析を行う不確実性誘導型プログレッシブラーニングフレームワークであるUGPLを紹介する。
3つのCTデータセットに対する実験により、UGPLは最先端のメソッドを一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2025-07-18T17:30:56Z) - AGIR: Assessing 3D Gait Impairment with Reasoning based on LLMs [0.0]
歩行障害は、神経変性疾患の早期診断、疾患モニタリング、治療評価において重要な役割を果たす。
近年のディープラーニングベースのアプローチは、分類精度を一貫して改善しているが、解釈可能性に欠けることが多い。
本稿では、事前訓練されたVQ-VAEモーショントークンライザと、一対のモーショントークン上で微調整されたLarge Language Model(LLM)からなる新しいパイプラインであるAGIRを紹介する。
論文 参考訳(メタデータ) (2025-03-23T17:12:16Z) - Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.45399098884364]
半正直な設定で一貫したバックドア検出フレームワークを提案する。
本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。
特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文 参考訳(メタデータ) (2025-03-21T06:12:06Z) - U2AD: Uncertainty-based Unsupervised Anomaly Detection Framework for Detecting T2 Hyperintensity in MRI Spinal Cord [7.811634659561162]
脊髄MR画像におけるT2過強度は、変性頚髄症などの病態において重要なバイオマーカーである。
深層学習法は病変検出の可能性を示してきたが、ほとんどの教師付きアプローチは大きな注釈付きデータセットに大きく依存している。
本稿では,これらの制約に対処するため,不確実性に基づくunsupervised Anomaly DetectionフレームワークであるU2ADを提案する。
論文 参考訳(メタデータ) (2025-03-17T17:33:32Z) - AnomalyAID: Reliable Interpretation for Semi-supervised Network Anomaly Detection [8.776201861433133]
AnomalyAIDは、異常検出プロセスを解釈し、解釈結果の信頼性を向上させることを目的としている。
本稿では,グローバル・ローカル・インタプリタを利用した新しい解釈手法を提案する。
両段階のモデル予測を特別な制約に合わせることで,ネットワーク異常検出のための新たな2段階半教師付き学習フレームワークを設計する。
論文 参考訳(メタデータ) (2024-11-18T05:39:00Z) - Model X-ray:Detecting Backdoored Models via Decision Boundary [62.675297418960355]
バックドア攻撃はディープニューラルネットワーク(DNN)に重大な脆弱性をもたらす
図形化された2次元(2次元)決定境界の解析に基づく新しいバックドア検出手法であるモデルX線を提案する。
提案手法は,クリーンサンプルが支配する意思決定領域とラベル分布の集中度に着目した2つの戦略を含む。
論文 参考訳(メタデータ) (2024-02-27T12:42:07Z) - Mitigating the Mutual Error Amplification for Semi-Supervised Object
Detection [92.52505195585925]
擬似ラベルの修正機構を導入し,相互誤りの増幅を緩和するクロス・インストラクション(CT)手法を提案する。
他の検出器からの予測を直接擬似ラベルとして扱う既存の相互指導法とは対照的に,我々はラベル修正モジュール(LRM)を提案する。
論文 参考訳(メタデータ) (2022-01-26T03:34:57Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。