論文の概要: Counterfactual Analysis in Dynamic Models: Copulas and Bounds
- arxiv url: http://arxiv.org/abs/2205.13832v1
- Date: Fri, 27 May 2022 08:51:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 02:50:41.704181
- Title: Counterfactual Analysis in Dynamic Models: Copulas and Bounds
- Title(参考訳): 動的モデルの非現実的解析:コピュラスと境界
- Authors: Martin Haugh and Raghav Singal
- Abstract要約: 構造因果モデル(SCM)における因果的メカニズムの明示的モデルについて, 対実的関心量(CQIs)を推定する目的で提案する。
隠れマルコフモデルによる「カジノの暖房」を考慮し、リニアプログラミング(LP)を用いて、不正行為によるカジノの勝利に対する下限と上限を構築する。
我々の研究は疫学や法理学に応用されており、より一般的には反実的非政治的評価に応用されている。
- 参考スコア(独自算出の注目度): 2.766648389933265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We provide an explicit model of the causal mechanism in a structural causal
model (SCM) with the goal of estimating counterfactual quantities of interest
(CQIs). We propose some standard dependence structures, i.e. copulas, as base
cases for the causal mechanism. While these base cases can be used to construct
more interesting copulas, there are uncountably many copulas in general and so
we formulate optimization problems for bounding the CQIs. As our ultimate goal
is counterfactual reasoning in dynamic models which may have latent-states, we
show by way of example that filtering / smoothing / sampling methods for these
models can be integrated with our modeling of the causal mechanism.
Specifically, we consider the "cheating-at-the-casino" application of a hidden
Markov model and use linear programming (LP) to construct lower and upper
bounds on the casino's winnings due to cheating. These bounds are considerably
tighter when we constrain the copulas in the LPs to be time-independent. We can
characterize the entire space of SCMs obeying counterfactual stability (CS),
and we use it to negatively answer the open question of Oberst and Sontag [18]
regarding the uniqueness of the Gumbel-max mechanism for modeling CS. Our work
has applications in epidemiology and legal reasoning, and more generally in
counterfactual off-policy evaluation, a topic of increasing interest in the
reinforcement learning community.
- Abstract(参考訳): 構造因果モデル (scm) における因果機構の明示的なモデルを提供し, 利益の反事実量(cqis)を推定することを目的としている。
因果機構の基礎として,いくつかの標準依存構造,すなわちコプラを提案する。
これらの基本ケースはより興味深いコピュラを構築するのに使うことができるが、一般的には数え切れないほど多くのコピュラが存在し、cqiを束縛するための最適化問題を定式化する。
我々の最終的なゴールは、潜在状態を持つかもしれない動的モデルの反実的推論であり、例えば、これらのモデルのフィルタリング/平滑化/サンプリング手法が因果メカニズムのモデリングと統合できることを示します。
具体的には,隠れマルコフモデルによる「カジノの暖房」を考慮し,リニアプログラミング(LP)を用いて,カジノの勝利に対する不正行為による下限と上限を構築する。
これらの境界は、lps内のコプラを時間に依存しないものに制限する場合、かなり厳しい。
我々は,CS をモデル化するための Gumbel-max 機構の独自性について,Oberst と Sontag [18] のオープンな疑問に否定的に答えるために,CS に従う SCM の全空間を特徴付けることができる。
我々の研究は疫学や法理学に応用されており、より一般的には反実的非政治評価において、強化学習コミュニティへの関心が高まりつつある。
関連論文リスト
- Distribution-consistency Structural Causal Models [7.054063730520563]
我々は,新しいテクスト分布-一貫性仮定を導入し,それに合わせて分布-一貫性構造因果モデル(DiscoSCM)を提案する。
モデルキャパシティの強化を具体化するために,DiscoSCM単独で実用的重要性を有する新たな因果パラメータ,一貫性のテキスト化(textitthe probability of consistency)を導入する。
論文 参考訳(メタデータ) (2024-01-29T06:46:15Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。
既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。
次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文 参考訳(メタデータ) (2023-08-16T07:36:58Z) - Distributed Bayesian Learning of Dynamic States [65.7870637855531]
提案アルゴリズムは有限状態隠れマルコフモデルに対する分散ベイズフィルタタスクである。
逐次状態推定や、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
論文 参考訳(メタデータ) (2022-12-05T19:40:17Z) - Maximum entropy exploration in contextual bandits with neural networks
and energy based models [63.872634680339644]
モデルには2つのクラスがあり、1つはニューラルネットワークを報酬推定器とし、もう1つはエネルギーベースモデルを示す。
両手法は、エネルギーベースモデルが最も優れた性能を持つ、よく知られた標準アルゴリズムより優れていることを示す。
これは、静的および動的設定でよく機能する新しいテクニックを提供し、特に連続的なアクション空間を持つ非線形シナリオに適している。
論文 参考訳(メタデータ) (2022-10-12T15:09:45Z) - A Theory of Dynamic Benchmarks [24.170405353348592]
動的ベンチマークの利点と実用的限界について検討する。
これらの結果は、経験的作業における観察されたボトルネックに関する理論的基礎と因果的説明を提供する。
論文 参考訳(メタデータ) (2022-10-06T18:56:46Z) - Causal Dynamics Learning for Task-Independent State Abstraction [61.707048209272884]
タスク独立状態抽象化(CDL)のための因果ダイナミクス学習を導入する。
CDLは、状態変数とアクションの間の不要な依存関係を取り除く理論的に証明された因果ダイナミクスモデルを学ぶ。
状態抽象化は、学習されたダイナミクスから導き出すことができる。
論文 参考訳(メタデータ) (2022-06-27T17:02:53Z) - Towards Robust and Reliable Algorithmic Recourse [11.887537452826624]
モデルシフトに堅牢なリコースを見つけるための敵対的トレーニングを活用する新しいフレームワークであるRObust Algorithmic Recourse(ROAR)を提案します。
また,モデルシフトにロバストなリコースの構築の重要性を強調する詳細な理論解析を行う。
論文 参考訳(メタデータ) (2021-02-26T17:38:52Z) - Model-Invariant State Abstractions for Model-Based Reinforcement
Learning [54.616645151708994]
textitmodel-invarianceという新しいタイプの状態抽象化を紹介します。
これにより、状態変数の見当たらない値の新しい組み合わせへの一般化が可能になる。
このモデル不変状態抽象化を通じて最適なポリシーを学習できることを実証する。
論文 参考訳(メタデータ) (2021-02-19T10:37:54Z) - Robustness of Model Predictions under Extension [3.766702945560518]
分析にモデルを使うのに注意すべき点は、予測因果効果と条件独立性はモデル拡張の下では堅牢でないことである。
定性モデル予測のロバスト性を効率的に評価するために,因果順序付け手法の使い方を示す。
平衡の力学系では、新しい洞察が適切なモデル拡張を選択するのにどのように役立つかを示す。
論文 参考訳(メタデータ) (2020-12-08T20:21:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。