論文の概要: Towards Computationally Efficient Responsibility Attribution in
Decentralized Partially Observable MDPs
- arxiv url: http://arxiv.org/abs/2302.12676v1
- Date: Fri, 24 Feb 2023 14:56:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 13:20:03.942401
- Title: Towards Computationally Efficient Responsibility Attribution in
Decentralized Partially Observable MDPs
- Title(参考訳): 分散部分観測型MDPにおける計算効率の良い責任帰属を目指して
- Authors: Stelios Triantafyllou, Goran Radanovic
- Abstract要約: 責任帰属(Responsibility Attribution)は、説明責任のあるマルチエージェント意思決定の鍵となる概念である。
エージェントの責任度を効率的に近似するモンテカルロ木探索(MCTS)方式を提案する。
シミュレーションベースのテストベッドを用いて,提案アルゴリズムの有効性を実験的に評価した。
- 参考スコア(独自算出の注目度): 5.825190876052148
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Responsibility attribution is a key concept of accountable multi-agent
decision making. Given a sequence of actions, responsibility attribution
mechanisms quantify the impact of each participating agent to the final
outcome. One such popular mechanism is based on actual causality, and it
assigns (causal) responsibility based on the actions that were found to be
pivotal for the considered outcome. However, the inherent problem of
pinpointing actual causes and consequently determining the exact responsibility
assignment has shown to be computationally intractable. In this paper, we aim
to provide a practical algorithmic solution to the problem of responsibility
attribution under a computational budget. We first formalize the problem in the
framework of Decentralized Partially Observable Markov Decision Processes
(Dec-POMDPs) augmented by a specific class of Structural Causal Models (SCMs).
Under this framework, we introduce a Monte Carlo Tree Search (MCTS) type of
method which efficiently approximates the agents' degrees of responsibility.
This method utilizes the structure of a novel search tree and a pruning
technique, both tailored to the problem of responsibility attribution. Other
novel components of our method are (a) a child selection policy based on linear
scalarization and (b) a backpropagation procedure that accounts for a
minimality condition that is typically used to define actual causality. We
experimentally evaluate the efficacy of our algorithm through a
simulation-based test-bed, which includes three team-based card games.
- Abstract(参考訳): 責任帰属は、説明責任のあるマルチエージェント意思決定の重要な概念である。
一連の行動が与えられると、責任帰属機構は、各参加者の最終的な結果に対する影響を定量化する。
そのような一般的なメカニズムの1つは、実際の因果関係に基づいており、考慮された結果にとって重要な行動に基づいて(因果的な)責任を割り当てる。
しかし、実際の原因を特定して正確な責任割り当てを決定するという本質的な問題は、計算的に難解であることが示されている。
本稿では,計算予算下での責任帰属問題に対する実用的なアルゴリズム的解決策を提案する。
まず,特定の構造因果モデル(scms)によって拡張された部分可観測マルコフ決定過程(dec-pomdps)の枠組みにおいて問題を定式化する。
本フレームワークでは,エージェントの責任度を効率的に近似するモンテカルロ木探索(MCTS)方式を提案する。
本手法は,新規な探索木の構造と,責任帰属の問題に合わせた刈り込み技術を利用する。
我々の方法の他の新しい構成要素は
(a)線形スカラー化に基づく子選抜政策とそれに基づく子選抜政策
(b)実際の因果関係を定義するのに一般的に用いられる最小限の条件を説明するバックプロパゲーション手順。
3つのチームベースのカードゲームを含むシミュレーションベースのテストベッドを用いて,アルゴリズムの有効性を実験的に評価した。
関連論文リスト
- Causal Responsibility Attribution for Human-AI Collaboration [62.474732677086855]
本稿では,人間のAIシステムにおける責任を体系的に評価するために,構造因果モデル(SCM)を用いた因果的枠組みを提案する。
2つのケーススタディは、多様な人間とAIのコラボレーションシナリオにおけるフレームワークの適応性を示している。
論文 参考訳(メタデータ) (2024-11-05T17:17:45Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - Decomposing Counterfactual Explanations for Consequential Decision
Making [11.17545155325116]
我々は、IMFと強い因果的前提の間のギャップを埋める、新しく実践的な枠組みを開発する。
textttは、共変特徴の潜在表現をアンタングルすることで、recoursesを生成する。
実世界のデータに関する我々の実験は、理論上動機づけられたリコースモデルと相関し、信頼性と低コストのリコースを提供するフレームワークの能力を強調します。
論文 参考訳(メタデータ) (2022-11-03T21:26:55Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - Actual Causality and Responsibility Attribution in Decentralized
Partially Observable Markov Decision Processes [22.408657774650358]
我々はこれらの概念を、不確実性の下でのマルチエージェントシーケンシャルな意思決定のための広く使われている枠組みの下で研究する。
実際の因果関係は特定の結果に焦点を当て、関心の成果を実現する上で重要な決定(行動)を識別することを目的としている。
責任帰属(Responsibility attribution)は相補的であり、意思決定者(エージェント)がこの結果にどの程度の責任を持つかを特定することを目的としている。
論文 参考訳(メタデータ) (2022-04-01T09:22:58Z) - On Blame Attribution for Accountable Multi-Agent Sequential Decision
Making [29.431349181232203]
協調型マルチエージェントシーケンシャル意思決定の文脈における責任帰属について検討する。
我々は、Shapley値のようなよく知られた非難帰属の手法が、パフォーマンスにインセンティブを与えていないことを示す。
そこで我々は,それが満足する特性の集合に特有の,新たな因果帰属法を提案する。
論文 参考訳(メタデータ) (2021-07-26T02:22:23Z) - The Causal Neural Connection: Expressiveness, Learnability, and
Inference [125.57815987218756]
構造因果モデル (Structuor causal model, SCM) と呼ばれるオブジェクトは、調査中のシステムのランダムな変動のメカニズムと源の集合を表す。
本稿では, 因果的階層定理 (Thm. 1, Bareinboim et al., 2020) がまだニューラルモデルに対して成り立っていることを示す。
我々はニューラル因果モデル(NCM)と呼ばれる特殊なタイプのSCMを導入し、因果推論に必要な構造的制約をエンコードする新しいタイプの帰納バイアスを定式化する。
論文 参考訳(メタデータ) (2021-07-02T01:55:18Z) - Modularity in Reinforcement Learning via Algorithmic Independence in
Credit Assignment [79.5678820246642]
提案手法は, 事前決定の順序に対して, スパース変化のみを必要とする伝達問題に対して, 政策段階の手法よりも, より標本効率が高いことを示す。
我々は最近提案された社会的意思決定の枠組みをマルコフ決定プロセスよりもよりきめ細かい形式主義として一般化する。
論文 参考訳(メタデータ) (2021-06-28T21:29:13Z) - Weakly Supervised Disentangled Generative Causal Representation Learning [21.392372783459013]
本研究は, 従来手法では, 監督下においても, 因果関係の要因を解消できないことを示す。
本稿では、因果制御可能な生成と因果表現学習を可能にする、新たな非絡み合い学習法を提案する。
論文 参考訳(メタデータ) (2020-10-06T11:38:41Z) - A Critical View of the Structural Causal Model [89.43277111586258]
相互作用を全く考慮せずに原因と効果を識別できることが示される。
本稿では,因果モデルの絡み合った構造を模倣する新たな逆行訓練法を提案する。
我々の多次元手法は, 合成および実世界の両方のデータセットにおいて, 文献的手法よりも優れている。
論文 参考訳(メタデータ) (2020-02-23T22:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。