論文の概要: Robust Direct Learning for Causal Data Fusion
- arxiv url: http://arxiv.org/abs/2211.00249v1
- Date: Tue, 1 Nov 2022 03:33:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:44:07.012814
- Title: Robust Direct Learning for Causal Data Fusion
- Title(参考訳): 因果データ融合のためのロバスト直接学習
- Authors: Xinyu Li, Yilin Li, Qing Cui, Longfei Li, Jun Zhou
- Abstract要約: 我々は、他のニュアンス関数から処理効果を分離するマルチソースデータを統合するためのフレームワークを提供する。
また,半パラメトリック効率理論の理論的洞察に基づく因果情報認識重み付け関数を提案する。
- 参考スコア(独自算出の注目度): 14.462235940634969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the era of big data, the explosive growth of multi-source heterogeneous
data offers many exciting challenges and opportunities for improving the
inference of conditional average treatment effects. In this paper, we
investigate homogeneous and heterogeneous causal data fusion problems under a
general setting that allows for the presence of source-specific covariates. We
provide a direct learning framework for integrating multi-source data that
separates the treatment effect from other nuisance functions, and achieves
double robustness against certain misspecification. To improve estimation
precision and stability, we propose a causal information-aware weighting
function motivated by theoretical insights from the semiparametric efficiency
theory; it assigns larger weights to samples containing more causal information
with high interpretability. We introduce a two-step algorithm, the weighted
multi-source direct learner, based on constructing a pseudo-outcome and
regressing it on covariates under a weighted least square criterion; it offers
us a powerful tool for causal data fusion, enjoying the advantages of easy
implementation, double robustness and model flexibility. In simulation studies,
we demonstrate the effectiveness of our proposed methods in both homogeneous
and heterogeneous causal data fusion scenarios.
- Abstract(参考訳): ビッグデータの時代において、マルチソース異種データの爆発的成長は多くのエキサイティングな課題と条件付き平均処理効果の推論を改善する機会を与えている。
本稿では,ソース固有共変量の存在を許容する一般設定の下で,同種および異種因果データ融合問題について検討する。
治療効果を他のニュアサンス関数から分離し、特定の誤特定に対して二重堅牢性を達成するマルチソースデータ統合のための直接学習フレームワークを提供する。
推定精度と安定性を向上させるため,半パラメトリック効率理論の理論的知見に基づく因果情報認識重み付け関数を提案し,より深い重み付けを高い解釈性を持つ因果情報を含むサンプルに割り当てる。
重み付き最小二乗基準の下で共変量に回帰することで,重み付き多元直接学習器という2段階アルゴリズムを導入し,実装の容易さ,二重ロバスト性,モデルの柔軟性といったメリットを享受し,因果的データ融合のための強力なツールを提供する。
シミュレーション研究において,同種および異種因果データ融合シナリオにおける提案手法の有効性を実証した。
関連論文リスト
- Multi-Source Conformal Inference Under Distribution Shift [41.701790856201036]
複数のバイアスのあるデータソースを活用することにより,対象個体数の分布自由な予測区間を得るという課題を考察する。
対象集団および源集団における未観測結果の定量値に対する効率的な影響関数を導出する。
本稿では、効率向上のための重み付き情報ソースとバイアス低減のための重み付き非情報ソースに対するデータ適応戦略を提案する。
論文 参考訳(メタデータ) (2024-05-15T13:33:09Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Distributionally Robust Learning [11.916893752969429]
本書は,データの摂動に頑健な包括的統計学習フレームワークを開発する。
各問題に対する引き込み可能なDRO緩和が導出され、境界と正規化の間の接続が確立される。
理論以外にも、数値実験や、合成データと実データを用いたケーススタディも含んでいる。
論文 参考訳(メタデータ) (2021-08-20T04:14:18Z) - BayesIMP: Uncertainty Quantification for Causal Data Fusion [52.184885680729224]
本研究では,複数の因果グラフに関連するデータセットを組み合わせ,対象変数の平均処理効果を推定する因果データ融合問題について検討する。
本稿では、確率積分とカーネル平均埋め込みのアイデアを組み合わせて、再生されたカーネルヒルベルト空間における干渉分布を表現するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-07T10:14:18Z) - Robust Bayesian Inference for Discrete Outcomes with the Total Variation
Distance [5.139874302398955]
離散的に評価された結果のモデルは、データがゼロインフレーション、過分散または汚染を示す場合、容易に誤特定される。
ここでは、Ttal Variation Distance (TVD) を用いた頑健な相違に基づくベイズ的アプローチを提案する。
我々は、我々のアプローチが堅牢で、シミュレーションおよび実世界のデータの範囲で予測性能を著しく改善していることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-26T09:53:06Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。