論文の概要: Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects
- arxiv url: http://arxiv.org/abs/2202.12891v1
- Date: Fri, 25 Feb 2022 18:59:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 14:10:53.363937
- Title: Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects
- Title(参考訳): 不均一処理効果推定のための観測データとランダム化データの組み合わせ
- Authors: Tobias Hatt, Jeroen Berrevoets, Alicia Curth, Stefan Feuerriegel,
Mihaela van der Schaar
- Abstract要約: 不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
- 参考スコア(独自算出の注目度): 82.20189909620899
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating heterogeneous treatment effects is an important problem across
many domains. In order to accurately estimate such treatment effects, one
typically relies on data from observational studies or randomized experiments.
Currently, most existing works rely exclusively on observational data, which is
often confounded and, hence, yields biased estimates. While observational data
is confounded, randomized data is unconfounded, but its sample size is usually
too small to learn heterogeneous treatment effects. In this paper, we propose
to estimate heterogeneous treatment effects by combining large amounts of
observational data and small amounts of randomized data via representation
learning. In particular, we introduce a two-step framework: first, we use
observational data to learn a shared structure (in form of a representation);
and then, we use randomized data to learn the data-specific structures. We
analyze the finite sample properties of our framework and compare them to
several natural baselines. As such, we derive conditions for when combining
observational and randomized data is beneficial, and for when it is not. Based
on this, we introduce a sample-efficient algorithm, called CorNet. We use
extensive simulation studies to verify the theoretical properties of CorNet and
multiple real-world datasets to demonstrate our method's superiority compared
to existing methods.
- Abstract(参考訳): 不均一な治療効果の推定は、多くの領域において重要な問題である。
このような治療効果を正確に推定するためには、一般的に観察研究やランダム化実験のデータに依存する。
現在、既存の作品の多くは観測データのみに依存しており、これはしばしば混同され、偏りのある推定結果となる。
観測データは統合されているが、ランダム化されたデータは未確立であるが、サンプルのサイズは通常小さすぎて不均一な処理効果を学習できない。
本稿では,多量の観測データと少量のランダム化データを表現学習により組み合わせ,不均一な処理効果を推定する。
まず、観測データを用いて共有構造(表現形式)を学習し、次にランダム化されたデータを用いてデータ固有の構造を学習する。
本フレームワークの有限サンプル特性を解析し,いくつかの自然ベースラインと比較する。
したがって、観測データとランダムデータを組み合わせた場合の条件とそうでない場合の条件を導出する。
そこで我々は,CorNetと呼ばれるサンプル効率のよいアルゴリズムを提案する。
本研究では,コーネットと複数の実世界のデータセットの理論的性質を検証するために,シミュレーション実験を行い,本手法が既存の手法よりも優れていることを示す。
関連論文リスト
- Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects [10.9134216137537]
既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。
我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-28T06:19:14Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Detecting hidden confounding in observational data using multiple
environments [0.81585306387285]
本論では, 隠れた接尾辞が存在する場合にのみ欠落する, 検証可能な条件不一致の理論について述べる。
ほとんどの場合、提案手法は隠れた共起の存在を正確に予測する。
論文 参考訳(メタデータ) (2022-05-27T12:20:09Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - What can the millions of random treatments in nonexperimental data
reveal about causes? [0.0]
この記事ではこのようなモデルとベイズ的アプローチを紹介し、非経験的データで典型的に使用可能な 1(n2)$ のペアワイズ観測を組み合わせる。
提案手法は, 一般のnswサンプル, 任意のサブポピュレーションおよび大容量スーパーサンプルにおいて, 因果効果を回復することを示す。
論文 参考訳(メタデータ) (2021-05-03T20:13:34Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - How and Why to Use Experimental Data to Evaluate Methods for
Observational Causal Inference [7.551130027327462]
ランダム化制御試験(OSRCT)の観察サンプリングを記述・解析する。
この手法は、処理効果の非偏見的な推定値で構築された観測データセットを作成するのに使用できる。
次に,37データセットに対して7つの因果推論手法を大規模に評価する。
論文 参考訳(メタデータ) (2020-10-06T21:44:01Z) - Tell Me Something I Don't Know: Randomization Strategies for Iterative
Data Mining [0.6100370338020054]
我々は、以前に発見されたパターンやモデルを考慮に入れられるように、データのランダム化の問題を考える。
本稿では,以前に発見されたパターンやモデルを考慮に入れたデータランダム化の問題について考察する。
論文 参考訳(メタデータ) (2020-06-16T19:20:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。