論文の概要: Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects
- arxiv url: http://arxiv.org/abs/2410.21343v1
- Date: Mon, 28 Oct 2024 06:19:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:39:11.434863
- Title: Combining Incomplete Observational and Randomized Data for Heterogeneous Treatment Effects
- Title(参考訳): 不完全観測データとランダム化データを組み合わせた不均一処理効果
- Authors: Dong Yao, Caizhi Tang, Qing Cui, Longfei Li,
- Abstract要約: 既存の観測データとランダム化データを統合するには,テキスト完全観測データが必要である。
我々は、HTE推定のためのtextbfCombine textbfIncomplete textbfObservationalデータとランダム化データに対するレジリエントなアプローチを提案する。
- 参考スコア(独自算出の注目度): 10.9134216137537
- License:
- Abstract: Data from observational studies (OSs) is widely available and readily obtainable yet frequently contains confounding biases. On the other hand, data derived from randomized controlled trials (RCTs) helps to reduce these biases; however, it is expensive to gather, resulting in a tiny size of randomized data. For this reason, effectively fusing observational data and randomized data to better estimate heterogeneous treatment effects (HTEs) has gained increasing attention. However, existing methods for integrating observational data with randomized data must require \textit{complete} observational data, meaning that both treated subjects and untreated subjects must be included in OSs. This prerequisite confines the applicability of such methods to very specific situations, given that including all subjects, whether treated or untreated, in observational studies is not consistently achievable. In our paper, we propose a resilient approach to \textbf{C}ombine \textbf{I}ncomplete \textbf{O}bservational data and randomized data for HTE estimation, which we abbreviate as \textbf{CIO}. The CIO is capable of estimating HTEs efficiently regardless of the completeness of the observational data, be it full or partial. Concretely, a confounding bias function is first derived using the pseudo-experimental group from OSs, in conjunction with the pseudo-control group from RCTs, via an effect estimation procedure. This function is subsequently utilized as a corrective residual to rectify the observed outcomes of observational data during the HTE estimation by combining the available observational data and the all randomized data. To validate our approach, we have conducted experiments on a synthetic dataset and two semi-synthetic datasets.
- Abstract(参考訳): 観測研究(OSs)のデータは広く利用でき、容易に入手できるが、しばしば矛盾するバイアスを含んでいる。
一方、ランダム化制御試験(RCT)から得られたデータは、これらのバイアスを減らすのに役立つが、収集には費用がかかるため、ランダム化データの小さなサイズになる。
このため、観測データとランダム化データを効果的に融合して、異種処理効果(HTE)をより正確に推定する手法が注目されている。
しかし、既存のランダム化データと観測データを統合するには、‘textit{complete} 観測データが必要なので、治療対象と未治療対象の両方をOSに含まなければならない。
この前提条件は、観察研究において、治療を受けるか治療を受けないかにかかわらず、すべての被験者を含むことが一貫して達成できないことを考慮し、そのような方法の適用性を非常に特定の状況に限定する。
本稿では,HTE推定のための観測データと乱数化データに対するレジリエントなアプローチを提案し,これを「textbf{C}ombine \textbf{I}ncomplete \textbf{O}bservational data」と略して「textbf{CIO}」と呼ぶ。
CIOは、観測データの完全性に関わらず、完全にあるいは部分的に、HTEを効率的に見積もることができる。
具体的には、まずOSの擬似実験群とRTTの擬似制御群とを併用して、効果推定法を用いて、共起バイアス関数を導出する。
その後、この関数を補正残差として利用し、利用可能な観測データと全ランダム化データを組み合わせることにより、HTE推定中の観測データの観測結果の正当化を行う。
提案手法を検証するために,合成データセットと2つの半合成データセットの実験を行った。
関連論文リスト
- Estimating Heterogeneous Treatment Effects by Combining Weak Instruments and Observational Data [44.31792000298105]
病状平均治療効果(CATE)の正確な予測は、パーソナライズされた医療とデジタルプラットフォーム分析において重要である。
我々は,信頼性の高いCATE推定を実現するために,IVと観測データを組み合わせた新しい手法を開発した。
論文 参考訳(メタデータ) (2024-06-10T16:40:55Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - B-Learner: Quasi-Oracle Bounds on Heterogeneous Causal Effects Under
Hidden Confounding [51.74479522965712]
本稿では,B-Learnerと呼ばれるメタラーナーを提案する。
我々は、その推定が有効で、鋭く、効率的であることを証明し、既存の方法よりも一般的な条件下で構成推定器に対して準オーラル特性を持つことを示した。
論文 参考訳(メタデータ) (2023-04-20T18:07:19Z) - Falsification before Extrapolation in Causal Effect Estimation [6.715453431174765]
個体群における因果関係は、しばしば観測データを用いて推定される。
本稿では,偏りのある観測推定を拒否するメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-27T21:47:23Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - DeepRite: Deep Recurrent Inverse TreatmEnt Weighting for Adjusting
Time-varying Confounding in Modern Longitudinal Observational Data [68.29870617697532]
時系列データにおける時間変化の相違に対するDeep Recurrent Inverse TreatmEnt重み付け(DeepRite)を提案する。
DeepRiteは、合成データから基底的真理を復元し、実際のデータから偏りのない処理効果を推定する。
論文 参考訳(メタデータ) (2020-10-28T15:05:08Z) - How and Why to Use Experimental Data to Evaluate Methods for
Observational Causal Inference [7.551130027327462]
ランダム化制御試験(OSRCT)の観察サンプリングを記述・解析する。
この手法は、処理効果の非偏見的な推定値で構築された観測データセットを作成するのに使用できる。
次に,37データセットに対して7つの因果推論手法を大規模に評価する。
論文 参考訳(メタデータ) (2020-10-06T21:44:01Z) - Causal Inference With Selectively Deconfounded Data [22.624714904663424]
我々は、平均治療効果(ATE)を推定する際に、大規模な統合された観測データセット(共同設立者なし)と小さな非統合された観測データセット(共同設立者明らかに)を組み込むことの利点を検討する。
理論的には, 待ち行列を所望の精度で推定するために必要なデコンストラクタデータの量を大幅に削減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-25T18:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。