論文の概要: Counterfactual Analysis in Dynamic Models: Copulas and Bounds
- arxiv url: http://arxiv.org/abs/2205.13832v1
- Date: Fri, 27 May 2022 08:51:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-31 02:50:41.704181
- Title: Counterfactual Analysis in Dynamic Models: Copulas and Bounds
- Title(参考訳): 動的モデルの非現実的解析:コピュラスと境界
- Authors: Martin Haugh and Raghav Singal
- Abstract要約: 構造因果モデル(SCM)における因果的メカニズムの明示的モデルについて, 対実的関心量(CQIs)を推定する目的で提案する。
隠れマルコフモデルによる「カジノの暖房」を考慮し、リニアプログラミング(LP)を用いて、不正行為によるカジノの勝利に対する下限と上限を構築する。
我々の研究は疫学や法理学に応用されており、より一般的には反実的非政治的評価に応用されている。
- 参考スコア(独自算出の注目度): 2.766648389933265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We provide an explicit model of the causal mechanism in a structural causal
model (SCM) with the goal of estimating counterfactual quantities of interest
(CQIs). We propose some standard dependence structures, i.e. copulas, as base
cases for the causal mechanism. While these base cases can be used to construct
more interesting copulas, there are uncountably many copulas in general and so
we formulate optimization problems for bounding the CQIs. As our ultimate goal
is counterfactual reasoning in dynamic models which may have latent-states, we
show by way of example that filtering / smoothing / sampling methods for these
models can be integrated with our modeling of the causal mechanism.
Specifically, we consider the "cheating-at-the-casino" application of a hidden
Markov model and use linear programming (LP) to construct lower and upper
bounds on the casino's winnings due to cheating. These bounds are considerably
tighter when we constrain the copulas in the LPs to be time-independent. We can
characterize the entire space of SCMs obeying counterfactual stability (CS),
and we use it to negatively answer the open question of Oberst and Sontag [18]
regarding the uniqueness of the Gumbel-max mechanism for modeling CS. Our work
has applications in epidemiology and legal reasoning, and more generally in
counterfactual off-policy evaluation, a topic of increasing interest in the
reinforcement learning community.
- Abstract(参考訳): 構造因果モデル (scm) における因果機構の明示的なモデルを提供し, 利益の反事実量(cqis)を推定することを目的としている。
因果機構の基礎として,いくつかの標準依存構造,すなわちコプラを提案する。
これらの基本ケースはより興味深いコピュラを構築するのに使うことができるが、一般的には数え切れないほど多くのコピュラが存在し、cqiを束縛するための最適化問題を定式化する。
我々の最終的なゴールは、潜在状態を持つかもしれない動的モデルの反実的推論であり、例えば、これらのモデルのフィルタリング/平滑化/サンプリング手法が因果メカニズムのモデリングと統合できることを示します。
具体的には,隠れマルコフモデルによる「カジノの暖房」を考慮し,リニアプログラミング(LP)を用いて,カジノの勝利に対する不正行為による下限と上限を構築する。
これらの境界は、lps内のコプラを時間に依存しないものに制限する場合、かなり厳しい。
我々は,CS をモデル化するための Gumbel-max 機構の独自性について,Oberst と Sontag [18] のオープンな疑問に否定的に答えるために,CS に従う SCM の全空間を特徴付けることができる。
我々の研究は疫学や法理学に応用されており、より一般的には反実的非政治評価において、強化学習コミュニティへの関心が高まりつつある。
関連論文リスト
- Rigorous Probabilistic Guarantees for Robust Counterfactual Explanations [80.86128012438834]
モデルシフトに対する反ファクトの堅牢性を計算することはNP完全であることを示す。
本稿では,頑健性の厳密な推定を高い保証で実現する新しい確率論的手法を提案する。
論文 参考訳(メタデータ) (2024-07-10T09:13:11Z) - Gradient Estimation and Variance Reduction in Stochastic and Deterministic Models [0.0]
この論文は制約のない非線形最適化問題を考察している。
このような問題の解決を可能にする鍵となる量である勾配そのものに着目する。
決定論と要素の双方に関わる問題の勾配を計算するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-14T14:41:58Z) - Distribution-consistency Structural Causal Models [6.276417011421679]
我々は,新しいテクスト分布-一貫性仮定を導入し,それに合わせて分布-一貫性構造因果モデル(DiscoSCM)を提案する。
モデルキャパシティの強化を具体化するために,DiscoSCM単独で実用的重要性を有する新たな因果パラメータ,一貫性のテキスト化(textitthe probability of consistency)を導入する。
論文 参考訳(メタデータ) (2024-01-29T06:46:15Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。
既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。
次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文 参考訳(メタデータ) (2023-08-16T07:36:58Z) - Distributed Bayesian Learning of Dynamic States [65.7870637855531]
提案アルゴリズムは有限状態隠れマルコフモデルに対する分散ベイズフィルタタスクである。
逐次状態推定や、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
論文 参考訳(メタデータ) (2022-12-05T19:40:17Z) - Maximum entropy exploration in contextual bandits with neural networks
and energy based models [63.872634680339644]
モデルには2つのクラスがあり、1つはニューラルネットワークを報酬推定器とし、もう1つはエネルギーベースモデルを示す。
両手法は、エネルギーベースモデルが最も優れた性能を持つ、よく知られた標準アルゴリズムより優れていることを示す。
これは、静的および動的設定でよく機能する新しいテクニックを提供し、特に連続的なアクション空間を持つ非線形シナリオに適している。
論文 参考訳(メタデータ) (2022-10-12T15:09:45Z) - A Theory of Dynamic Benchmarks [24.170405353348592]
動的ベンチマークの利点と実用的限界について検討する。
これらの結果は、経験的作業における観察されたボトルネックに関する理論的基礎と因果的説明を提供する。
論文 参考訳(メタデータ) (2022-10-06T18:56:46Z) - Causal Dynamics Learning for Task-Independent State Abstraction [61.707048209272884]
タスク独立状態抽象化(CDL)のための因果ダイナミクス学習を導入する。
CDLは、状態変数とアクションの間の不要な依存関係を取り除く理論的に証明された因果ダイナミクスモデルを学ぶ。
状態抽象化は、学習されたダイナミクスから導き出すことができる。
論文 参考訳(メタデータ) (2022-06-27T17:02:53Z) - Towards Robust and Reliable Algorithmic Recourse [11.887537452826624]
モデルシフトに堅牢なリコースを見つけるための敵対的トレーニングを活用する新しいフレームワークであるRObust Algorithmic Recourse(ROAR)を提案します。
また,モデルシフトにロバストなリコースの構築の重要性を強調する詳細な理論解析を行う。
論文 参考訳(メタデータ) (2021-02-26T17:38:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。