論文の概要: To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation
- arxiv url: http://arxiv.org/abs/2202.02096v1
- Date: Fri, 4 Feb 2022 12:08:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-07 21:18:04.872502
- Title: To Impute or not to Impute? -- Missing Data in Treatment Effect
Estimation
- Title(参考訳): 誘惑するか 誘惑しないのか?
--治療効果推定における欠落データ
- Authors: Jeroen Berrevoets, Fergus Imrie, Trent Kyono, James Jordon, Mihaela
van der Schaar
- Abstract要約: 我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。
本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。
私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
- 参考スコア(独自算出の注目度): 84.76186111434818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Missing data is a systemic problem in practical scenarios that causes noise
and bias when estimating treatment effects. This makes treatment effect
estimation from data with missingness a particularly tricky endeavour. A key
reason for this is that standard assumptions on missingness are rendered
insufficient due to the presence of an additional variable, treatment, besides
the individual and the outcome. Having a treatment variable introduces
additional complexity with respect to why some variables are missing that is
not fully explored by previous work. In our work we identify a new missingness
mechanism, which we term mixed confounded missingness (MCM), where some
missingness determines treatment selection and other missingness is determined
by treatment selection. Given MCM, we show that naively imputing all data leads
to poor performing treatment effects models, as the act of imputation
effectively removes information necessary to provide unbiased estimates.
However, no imputation at all also leads to biased estimates, as missingness
determined by treatment divides the population in distinct subpopulations,
where estimates across these populations will be biased. Our solution is
selective imputation, where we use insights from MCM to inform precisely which
variables should be imputed and which should not. We empirically demonstrate
how various learners benefit from selective imputation compared to other
solutions for missing data.
- Abstract(参考訳): データ不足は、治療効果を推定する際にノイズやバイアスを引き起こす実践シナリオにおけるシステム的な問題である。
これにより、不備のあるデータから処理効果を推定できる。
主な理由は、不足に関する標準的な仮定が、個人と結果以外に追加の変数や治療が存在するため不十分であるからである。
処理変数を持つことは、以前の作業で十分に調査されていない変数が欠落している理由に関して、さらなる複雑さをもたらす。
本研究では,MCM (Mixed Con founded missingness) と呼ばれる新しい欠損機構を同定し,欠損が治療選択を判断し,他の欠損が治療選択によって決定される。
MCMを仮定すると、全てのデータを因果的にインプットすることで、不均衡な推定を行うために必要な情報を効果的に除去するので、処理効果のモデルが貧弱になることが示される。
しかし、治療によって決定される欠如は、これらの人口の推計が偏る異なる亜集団で人口を分断するので、全く偏りのある推定に繋がるものではない。
私たちのソリューションは選択的計算であり、CMMからの洞察を使ってどの変数をインプットすべきか、どの変数をインプットすべきかを正確に知らせる。
各種学習者が選択的計算によってどのような恩恵を受けるかを実験的に示す。
関連論文リスト
- Quantifying Aleatoric Uncertainty of the Treatment Effect: A Novel Orthogonal Learner [72.20769640318969]
医療の安全性と有効性を理解するためには,観測データから因果量の推定が重要である。
医療従事者は、平均因果量の推定だけでなく、治療効果のランダム性をランダムな変数として理解する必要がある。
このランダム性はアレタリック不確実性と呼ばれ、治療効果の利益や量子化の確率を理解するために必要である。
論文 参考訳(メタデータ) (2024-11-05T18:14:49Z) - Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - Continuous Treatment Effects with Surrogate Outcomes [12.548638259932915]
持続的治療効果の予測におけるサロゲートの役割について検討した。
そこで本研究では,サロゲートを効率的に分析に組み込む2つの頑健な手法を提案する。
論文 参考訳(メタデータ) (2024-01-31T20:50:18Z) - Improving Image-Based Precision Medicine with Uncertainty-Aware Causal
Models [3.5770353345663053]
ベイジアンディープラーニング(英語版)を用いて、いくつかの治療における現実的および対実的な結果に対する後部分布を推定する。
本モデルを用いて,多発性硬化症患者のMR脳画像の多施設データセットを用いて,今後新たなT2病変数を予測し,評価する。
論文 参考訳(メタデータ) (2023-05-05T20:08:40Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - Treatment Effect Risk: Bounds and Inference [58.442274475425144]
平均的な治療効果は社会福祉の変化を測定するため、たとえ肯定的であっても、人口の約10%に悪影響を及ぼすリスクがある。
本稿では,ICT分布のリスク条件値(CVaR)として定式化されたこの重要なリスク尺度をどう評価するかを検討する。
いくつかの境界は、複素CATE関数を単一の計量に要約したものと解釈することもでき、有界であることとは無関係に興味を持つ。
論文 参考訳(メタデータ) (2022-01-15T17:21:26Z) - BITES: Balanced Individual Treatment Effect for Survival data [0.0]
患者予後に対する介入の効果を推定することは、パーソナライズされた医療の重要な側面の1つである。
時間から時間までのデータは、治療最適化にはほとんど使われない。
我々は、治療特異的な半パラメトリックコックス損失と治療バランスの深いディープニューラルネットワークを組み合わせたBITESというアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-05T10:39:31Z) - Non parametric estimation of causal populations in a counterfactual
scenario [6.247939901619901]
本稿では,この問題を欠落データモデルとして再定義する革新的な手法を提案する。
目的は、治療と結果の関数として定義される、真菌集団の隠れ分布を推定することである。
論文 参考訳(メタデータ) (2021-12-08T13:51:24Z) - Estimating Average Treatment Effects via Orthogonal Regularization [18.586616164230566]
従来の方法は根拠のない結果に基づいて成果を見積もるが、根拠のない結果に課されるいかなる制約も無視する。
非定常性を利用した平均治療効果を推定するための新しい正規化フレームワークを提案する。
我々はDONUTが最先端技術を大幅に上回っていることを実証する。
論文 参考訳(メタデータ) (2021-01-21T08:05:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。