論文の概要: Counterfactual Effect Decomposition in Multi-Agent Sequential Decision Making
- arxiv url: http://arxiv.org/abs/2410.12539v1
- Date: Wed, 16 Oct 2024 13:20:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:41:21.598581
- Title: Counterfactual Effect Decomposition in Multi-Agent Sequential Decision Making
- Title(参考訳): マルチエージェントシークエンシャル意思決定における因果的効果分解
- Authors: Stelios Triantafyllou, Aleksa Sukovic, Yasaman Zolfimoselo, Goran Radanovic,
- Abstract要約: 本稿では,各エージェントに寄与し,各エージェントに寄与し,各要因に寄与するスコアを変動させることにより,その効果を分解する新たな因果的説明式を提案する。
エージェントの作用の総合的反事実効果は, エージェントの作用を伝播する効果を計測する要素と, 状態遷移を伝播する効果に関連する要素の2つに分解できることを示す。
- 参考スコア(独自算出の注目度): 9.469649321687928
- License:
- Abstract: We address the challenge of explaining counterfactual outcomes in multi-agent Markov decision processes. In particular, we aim to explain the total counterfactual effect of an agent's action on the outcome of a realized scenario through its influence on the environment dynamics and the agents' behavior. To achieve this, we introduce a novel causal explanation formula that decomposes the counterfactual effect by attributing to each agent and state variable a score reflecting their respective contributions to the effect. First, we show that the total counterfactual effect of an agent's action can be decomposed into two components: one measuring the effect that propagates through all subsequent agents' actions and another related to the effect that propagates through the state transitions. Building on recent advancements in causal contribution analysis, we further decompose these two effects as follows. For the former, we consider agent-specific effects -- a causal concept that quantifies the counterfactual effect of an agent's action that propagates through a subset of agents. Based on this notion, we use Shapley value to attribute the effect to individual agents. For the latter, we consider the concept of structure-preserving interventions and attribute the effect to state variables based on their "intrinsic" contributions. Through extensive experimentation, we demonstrate the interpretability of our decomposition approach in a Gridworld environment with LLM-assisted agents and a sepsis management simulator.
- Abstract(参考訳): マルチエージェントのマルコフ決定プロセスにおいて,反実的な結果を説明するという課題に対処する。
特に,エージェントの行動が現実的なシナリオの結果に与える影響を,エージェントの環境動態とエージェントの行動に影響を与えることによって説明することを目的とする。
これを実現するために,各エージェントに寄与し,各エージェントがそれぞれの効果に寄与するスコアを変動させることにより,その効果を分解する新たな因果説明式を導入する。
まず, エージェントの作用の総合的反事実効果は, エージェントの作用を伝播する効果と, 状態遷移を伝播する効果の2つの成分に分解できることを示す。
因果コントリビューション分析の最近の進歩に基づき、これらの2つの効果をさらに分解する。
前者にとって、エージェント特異的効果は、エージェントのサブセットを介して伝播するエージェントのアクションの反事実効果を定量化する因果概念である。
この概念に基づいて、個々のエージェントに効果を属性付けるためにShapley値を使用します。
後者については、構造保存的介入の概念を考察し、その「本質的な」貢献に基づく状態変数の影響を考察する。
広汎な実験を通じて,LLM支援エージェントとセシス管理シミュレータを用いたGridworld環境における分解手法の解釈可能性を示す。
関連論文リスト
- Causal Influence in Federated Edge Inference [34.487472866247586]
本稿では、未ラベルのストリーミングデータを用いて、接続性のある異種エージェントが推論を行う環境について考察する。
不確実性を克服するために、エージェントは、融合センターを通じてローカルな推論を交換することで互いに協力する。
エージェントの関与パターンや核融合センターの方針を反映した様々なシナリオを考察した。
論文 参考訳(メタデータ) (2024-05-02T13:06:50Z) - Neural Interaction Energy for Multi-Agent Trajectory Prediction [55.098754835213995]
ニューラル・インタラクション・エナジー(MATE)によるマルチエージェント軌道予測(Multi-Agent Trajectory Prediction)というフレームワークを導入する。
MATEは神経相互作用エネルギーを用いてエージェントの対話運動を評価する。
時間的安定性を高めるために,エージェント間相互作用制約とエージェント内動作制約という2つの制約を導入する。
論文 参考訳(メタデータ) (2024-04-25T12:47:47Z) - Agent-Specific Effects: A Causal Effect Propagation Analysis in Multi-Agent MDPs [13.524274041966539]
エージェント特異的効果(ASE)は、エージェントの作用が他のエージェントを介して伝播する結果に与える影響を測定する新しい因果量である。
我々は,敗血症管理環境を含むシミュレーションベースのテストベッドを用いて,cf-ASEの有用性を実験的に評価した。
論文 参考訳(メタデータ) (2023-10-17T15:12:56Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Inferring Individual Direct Causal Effects Under Heterogeneous Peer Influence [10.609670658904562]
ネットワークにおける因果推論は、ユニットの結果がピアの治療や結果に影響された場合に発生する干渉を考慮に入れなければならない。
本稿では,ネットワーク構造,干渉条件,因果依存性に関する様々な仮定を捉えることができるネットワークの構造因果モデルを提案する。
因果モデルを用いて、潜在的な異種コンテキストを見つけ、個別の因果効果を推定する新しいグラフニューラルネットワークに基づく推定器を提案する。
論文 参考訳(メタデータ) (2023-05-27T13:57:26Z) - Moving Forward by Moving Backward: Embedding Action Impact over Action
Semantics [57.671493865825255]
本稿では,潜伏埋め込みを用いた飛行行動の影響をモデル化する。
これらの潜在アクション埋め込みと、トランスフォーマーベースのポリシーヘッドを組み合わせることで、アクション適応ポリシーを設計する。
当社のAAPは, 対面時, 推論時, 動作不足時, 以前は見えなかった摂動行動空間においても, 高い性能を示した。
論文 参考訳(メタデータ) (2023-04-24T17:35:47Z) - A Reinforcement Learning Framework for Dynamic Mediation Analysis [16.284199152492487]
無限地平線設定における動的媒介効果を評価するための強化学習フレームワークを提案する。
平均治療効果を即時直接効果、即時媒介効果、遅延直接効果、遅延媒介効果に分解する。
我々はこれらの因果効果を推定するために、RLフレームワークの下で頑健で半パラメトリックで効率的な推定器を開発する。
論文 参考訳(メタデータ) (2023-01-31T00:50:05Z) - Mitigating Negative Side Effects via Environment Shaping [27.400267388362654]
非構造環境で作動するエージェントは、しばしば負の副作用(NSE)を引き起こす
本稿では,この問題を解き,理論特性を解析するアルゴリズムを提案する。
提案手法は,エージェントが割り当てられたタスクを完了させる能力に影響を与えずに,nseを効果的に緩和できることを示す。
論文 参考訳(メタデータ) (2021-02-13T22:15:00Z) - Loss Bounds for Approximate Influence-Based Abstraction [81.13024471616417]
影響に基づく抽象化は、システムの残りの部分が与える「影響」とともに、局所的なサブプロブレムをモデル化することでレバレッジを得ることを目的としている。
本稿では,理論的観点から,そのような手法の性能について考察する。
交叉エントロピーで訓練されたニューラルネットワークは、近似的な影響表現を学習するのに適していることを示す。
論文 参考訳(メタデータ) (2020-11-03T15:33:10Z) - Understanding Adversarial Examples from the Mutual Influence of Images
and Perturbations [83.60161052867534]
クリーンな画像と敵の摂動を遠ざけることで敵の例を分析し,その相互への影響を分析した。
以上の結果から,画像と普遍摂動の関係に対する新たな視点が示唆された。
我々は、オリジナルトレーニングデータを活用することなく、目標とするユニバーサルアタックの挑戦的なタスクを最初に達成した人物です。
論文 参考訳(メタデータ) (2020-07-13T05:00:09Z) - Self-Attention Attribution: Interpreting Information Interactions Inside
Transformer [89.21584915290319]
本稿では,トランスフォーマー内の情報相互作用を解釈する自己帰属属性法を提案する。
本研究は,BERT に対する非目標攻撃の実装において,その属性を敵対パターンとして用いることができることを示す。
論文 参考訳(メタデータ) (2020-04-23T14:58:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。