論文の概要: Resolving Spurious Correlations in Causal Models of Environments via
Interventions
- arxiv url: http://arxiv.org/abs/2002.05217v2
- Date: Mon, 7 Dec 2020 19:40:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 19:29:55.711225
- Title: Resolving Spurious Correlations in Causal Models of Environments via
Interventions
- Title(参考訳): 介入による環境因果モデルにおけるスプリアス相関の解消
- Authors: Sergei Volodin, Nevan Wichers, Jeremy Nixon
- Abstract要約: 本稿では,強化学習環境の因果モデル推定の問題について考察する。
提案手法は,因果モデルにおける誤り発見のための介入を行うエージェントにインセンティブを与える報酬関数を設計する。
グリッドワールド環境における実験結果から,本手法はベースラインよりも因果モデルが優れていることが示された。
- 参考スコア(独自算出の注目度): 2.836066255205732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal models bring many benefits to decision-making systems (or agents) by
making them interpretable, sample-efficient, and robust to changes in the input
distribution. However, spurious correlations can lead to wrong causal models
and predictions. We consider the problem of inferring a causal model of a
reinforcement learning environment and we propose a method to deal with
spurious correlations. Specifically, our method designs a reward function that
incentivizes an agent to do an intervention to find errors in the causal model.
The data obtained from doing the intervention is used to improve the causal
model. We propose several intervention design methods and compare them. The
experimental results in a grid-world environment show that our approach leads
to better causal models compared to baselines: learning the model on data from
a random policy or a policy trained on the environment's reward. The main
contribution consists of methods to design interventions to resolve spurious
correlations.
- Abstract(参考訳): 因果モデルは、入力分布の変化に対して解釈可能で、サンプル効率が高く、堅牢にすることで、意思決定システム(またはエージェント)に多くの利点をもたらします。
しかし、スプリアス相関は間違った因果モデルや予測につながる可能性がある。
本稿では,強化学習環境の因果関係を推定する問題を考察し,突発的相関に対処する手法を提案する。
具体的には,エージェントが因果モデルにおける誤りを見つけるための介入を動機付ける報酬関数を設計する。
介入によって得られたデータは因果モデルを改善するために使用される。
いくつかの介入設計手法を提案し、比較する。
グリッド・ワールド環境における実験結果は、我々のアプローチがベースラインと比較してより良い因果モデルをもたらすことを示している:ランダムなポリシーや、環境の報酬で訓練されたポリシーからデータモデルを学ぶ。
主な貢献は、スプリアス相関を解決するための介入を設計する方法である。
関連論文リスト
- Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - From Identifiable Causal Representations to Controllable Counterfactual Generation: A Survey on Causal Generative Modeling [17.074858228123706]
基本的な理論、方法論、欠点、データセット、メトリクスに重点を置いています。
フェアネス、プライバシ、アウト・オブ・ディストリビューションの一般化、精密医療、生物科学における因果生成モデルの応用について述べる。
論文 参考訳(メタデータ) (2023-10-17T05:45:32Z) - Causal Analysis for Robust Interpretability of Neural Networks [0.2519906683279152]
我々は、事前学習されたニューラルネットワークの因果効果を捉えるための頑健な介入に基づく手法を開発した。
分類タスクで訓練された視覚モデルに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-15T18:37:24Z) - Causal Disentangled Variational Auto-Encoder for Preference
Understanding in Recommendation [50.93536377097659]
本稿では,コメンテータシステムにおける対話データから因果不整合表現を学習するためのCaD-VAE(Causal Disentangled Variational Auto-Encoder)を提案する。
この手法は構造因果モデルを用いて、潜在因子間の因果関係を記述する因果表現を生成する。
論文 参考訳(メタデータ) (2023-04-17T00:10:56Z) - Less is More: Mitigate Spurious Correlations for Open-Domain Dialogue
Response Generation Models by Causal Discovery [52.95935278819512]
本研究で得られたCGDIALOGコーパスに基づくオープンドメイン応答生成モデルのスプリアス相関に関する最初の研究を行った。
因果探索アルゴリズムに着想を得て,反応生成モデルの学習と推論のための新しいモデル非依存手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T06:33:48Z) - De-Biasing Generative Models using Counterfactual Methods [0.0]
我々はCausal Counterfactual Generative Model (CCGM) と呼ばれる新しいデコーダベースのフレームワークを提案する。
提案手法は,因果関係の忠実さを強調するために,因果関係の潜在空間VAEモデルと特定の修正を加えたものである。
因果的学習と符号化/復号化が因果的介入の質をいかに高めるかを検討する。
論文 参考訳(メタデータ) (2022-07-04T16:53:20Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Latent Causal Invariant Model [128.7508609492542]
現在の教師付き学習は、データ適合プロセス中に急激な相関を学習することができる。
因果予測を求める潜在因果不変モデル(LaCIM)を提案する。
論文 参考訳(メタデータ) (2020-11-04T10:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。