論文の概要: Learning Infomax and Domain-Independent Representations for Causal
Effect Inference with Real-World Data
- arxiv url: http://arxiv.org/abs/2202.10885v1
- Date: Tue, 22 Feb 2022 13:35:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 14:56:31.662982
- Title: Learning Infomax and Domain-Independent Representations for Causal
Effect Inference with Real-World Data
- Title(参考訳): 実世界データを用いた因果効果推論のためのインフォマックスとドメイン独立表現の学習
- Authors: Zhixuan Chu, Stephen Rathbun, Sheng Li
- Abstract要約: 上記の問題を解くためにInfomaxとDomain-Independent Representationsを学習する。
提案手法は,因果関係の推論における最先端性能を実現する。
- 参考スコア(独自算出の注目度): 9.601837205635686
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The foremost challenge to causal inference with real-world data is to handle
the imbalance in the covariates with respect to different treatment options,
caused by treatment selection bias. To address this issue, recent literature
has explored domain-invariant representation learning based on different domain
divergence metrics (e.g., Wasserstein distance, maximum mean discrepancy,
position-dependent metric, and domain overlap). In this paper, we reveal the
weaknesses of these strategies, i.e., they lead to the loss of predictive
information when enforcing the domain invariance; and the treatment effect
estimation performance is unstable, which heavily relies on the characteristics
of the domain distributions and the choice of domain divergence metrics.
Motivated by information theory, we propose to learn the Infomax and
Domain-Independent Representations to solve the above puzzles. Our method
utilizes the mutual information between the global feature representations and
individual feature representations, and the mutual information between feature
representations and treatment assignment predictions, in order to maximally
capture the common predictive information for both treatment and control
groups. Moreover, our method filters out the influence of instrumental and
irrelevant variables, and thus it effectively increases the predictive ability
of potential outcomes. Experimental results on both the synthetic and
real-world datasets show that our method achieves state-of-the-art performance
on causal effect inference. Moreover, our method exhibits reliable prediction
performances when facing data with different characteristics of data
distributions, complicated variable types, and severe covariate imbalance.
- Abstract(参考訳): 実世界のデータに対する因果推論の最大の課題は、治療選択バイアスによって引き起こされる様々な治療オプションに対する共変量の不均衡を扱うことである。
この問題に対処するために、近年の文献では、異なる領域の発散距離(wasserstein距離、最大平均偏差、位置依存計量、領域重なりなど)に基づいて、ドメイン不変表現学習を探求している。
本稿では,これらの戦略の弱点,すなわち,ドメインの分散を強制する際の予測情報の損失,および処理効果推定性能が不安定であることを明らかにし,その特性とドメインの多様化指標の選択に大きく依存する。
情報理論に動機付け,これらの問題を解くためにInfomaxとDomain-Independent Representationsを学習することを提案する。
本手法では,グローバル特徴表現と個々の特徴表現の相互情報と,特徴表現と処置割り当て予測との相互情報を用いて,治療群と制御群の両方の共通予測情報を最大に把握する。
さらに,本手法は器用変数と無関係変数の影響を除去し,潜在的結果の予測能力を効果的に向上させる。
実験結果から,本手法は因果効果推定における最先端性能を達成できることが示唆された。
さらに,データ分布の異なる特性,複雑な変数型,厳密な共変量不均衡に直面する場合,信頼性の高い予測性能を示す。
関連論文リスト
- Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [14.980926991441345]
介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
観察的および介入的設定における各変数の限界分布の比較に依拠する介入忠実性を導入する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文 参考訳(メタデータ) (2024-05-28T16:07:17Z) - Optimal Aggregation of Prediction Intervals under Unsupervised Domain Shift [9.387706860375461]
分散シフトは、基礎となるデータ生成プロセスが変化したときに発生し、モデルの性能のずれにつながる。
予測間隔は、その基礎となる分布によって引き起こされる不確実性を特徴づける重要なツールとして機能する。
予測区間を集約し,最小の幅と対象領域を適切にカバーする手法を提案する。
論文 参考訳(メタデータ) (2024-05-16T17:55:42Z) - Disentangle Estimation of Causal Effects from Cross-Silo Data [14.684584362172666]
本稿では,モデルパラメータのシームレスなクロスサイロ伝送を容易にするために設計された,革新的なアンタングルアーキテクチャを提案する。
種々の欠落領域におけるバイアスを効果的に緩和するために,グローバルな制約を方程式に導入する。
我々の手法は最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2024-01-04T09:05:37Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Self-balanced Learning For Domain Generalization [64.99791119112503]
ドメインの一般化は、モデルが未知の統計を持つ対象のドメインに一般化できるように、マルチドメインのソースデータの予測モデルを学ぶことを目的としている。
既存のアプローチのほとんどは、ソースデータがドメインとクラスの両方の観点からバランスよく調整されているという前提の下で開発されている。
本稿では,多領域ソースデータの分布の違いによるバイアスを軽減するために,損失の重み付けを適応的に学習する自己均衡型領域一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-31T03:17:54Z) - Robust Bayesian Inference for Discrete Outcomes with the Total Variation
Distance [5.139874302398955]
離散的に評価された結果のモデルは、データがゼロインフレーション、過分散または汚染を示す場合、容易に誤特定される。
ここでは、Ttal Variation Distance (TVD) を用いた頑健な相違に基づくベイズ的アプローチを提案する。
我々は、我々のアプローチが堅牢で、シミュレーションおよび実世界のデータの範囲で予測性能を著しく改善していることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-26T09:53:06Z) - Matching in Selective and Balanced Representation Space for Treatment
Effects Estimation [10.913802831701082]
深層表現学習とマッチングに基づく特徴選択表現マッチング(FSRM)手法を提案する。
本研究では, FSRM法の性能を3つのデータセットで評価し, 現状の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-15T02:07:34Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z) - Learning Overlapping Representations for the Estimation of
Individualized Treatment Effects [97.42686600929211]
観測データから代替案の可能性を推定することは難しい問題である。
入力のドメイン不変表現を学習するアルゴリズムは、しばしば不適切であることを示す。
我々は,様々なベンチマークデータセットの最先端性を大幅に向上させる,ディープカーネル回帰アルゴリズムと後続正規化フレームワークを開発した。
論文 参考訳(メタデータ) (2020-01-14T12:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。