論文の概要: Progressive Generalization Risk Reduction for Data-Efficient Causal Effect Estimation
- arxiv url: http://arxiv.org/abs/2411.11256v1
- Date: Mon, 18 Nov 2024 03:17:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:35:36.049659
- Title: Progressive Generalization Risk Reduction for Data-Efficient Causal Effect Estimation
- Title(参考訳): データ効率の良い因果効果推定のための進行的一般化リスク低減
- Authors: Hechuan Wen, Tong Chen, Guanhua Ye, Li Kheng Chai, Shazia Sadiq, Hongzhi Yin,
- Abstract要約: 因果効果推定(英: Causal effect Estimation、CEE)は、エンティティの観測されていない反事実結果を予測する重要なツールである。
本稿では,ラベル付きデータサンプルが最初から不足している,より現実的なCEE設定について検討する。
バッチワイズラベル取得のためのモデルアグノスティック因果アクティブラーニング(MACAL)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 30.49865329385806
- License:
- Abstract: Causal effect estimation (CEE) provides a crucial tool for predicting the unobserved counterfactual outcome for an entity. As CEE relaxes the requirement for ``perfect'' counterfactual samples (e.g., patients with identical attributes and only differ in treatments received) that are impractical to obtain and can instead operate on observational data, it is usually used in high-stake domains like medical treatment effect prediction. Nevertheless, in those high-stake domains, gathering a decently sized, fully labelled observational dataset remains challenging due to hurdles associated with costs, ethics, expertise and time needed, etc., of which medical treatment surveys are a typical example. Consequently, if the training dataset is small in scale, low generalization risks can hardly be achieved on any CEE algorithms. Unlike existing CEE methods that assume the constant availability of a dataset with abundant samples, in this paper, we study a more realistic CEE setting where the labelled data samples are scarce at the beginning, while more can be gradually acquired over the course of training -- assuredly under a limited budget considering their expensive nature. Then, the problem naturally comes down to actively selecting the best possible samples to be labelled, e.g., identifying the next subset of patients to conduct the treatment survey. However, acquiring quality data for reducing the CEE risk under limited labelling budgets remains under-explored until now. To fill the gap, we theoretically analyse the generalization risk from an intriguing perspective of progressively shrinking its upper bound, and develop a principled label acquisition pipeline exclusively for CEE tasks. With our analysis, we propose the Model Agnostic Causal Active Learning (MACAL) algorithm for batch-wise label acquisition, which aims to reduce both the CEE model's uncertainty and the post-acquisition ...
- Abstract(参考訳): 因果効果推定(英: Causal effect Estimation、CEE)は、エンティティの観測されていない反事実結果を予測する重要なツールである。
CEEは「完璧な」対実的なサンプル(例えば、同一の属性を持つ患者と受け継いだ治療のみが異なる)の取得が不可能で、観察データで操作できない要件を緩和するので、医療効果予測のような高い領域で一般的に用いられる。
とはいえ、これらのハイテイクドメインでは、医療調査が典型例であるコストや倫理、専門知識、時間などに関わるハードルのため、十分にラベル付けされた十分なサイズの観測データセットを集めることは依然として困難である。
したがって、トレーニングデータセットが小規模であれば、どんなCEEアルゴリズムでも低い一般化リスクは達成できない。
豊富なサンプルを持つデータセットの定常的な可用性を仮定する既存のCEEメソッドとは異なり、本論文では、ラベル付きデータサンプルが最初から不足しているような、より現実的なCEE設定について検討する。
そして、この問題は、例えば、治療調査を行う患者の次のサブセットを特定するなど、ラベル付けすべき最良のサンプルを積極的に選択することにある。
しかし、限られたラベル付け予算の下でCEEリスクを低減するための品質データを取得することは、これまでは未検討のままである。
このギャップを埋めるために、我々は、その上限を徐々に縮めるという興味深い視点から一般化リスクを理論的に分析し、CEEタスク専用の原則付きラベル取得パイプラインを開発する。
本分析では,CEEモデルの不確実性と後取得の両面を削減することを目的とした,バッチワイズラベル取得のためのモデル非依存因果アクティブラーニング(MACAL)アルゴリズムを提案する。
関連論文リスト
- SepsisLab: Early Sepsis Prediction with Uncertainty Quantification and Active Sensing [67.8991481023825]
セプシスは米国での院内死亡の主な原因である。
既存の予測モデルは通常、情報不足の少ない高品質なデータで訓練される。
限られた観察により信頼性の低い高リスク患者に対して,ロバストな能動センシングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:47:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Modeling Disagreement in Automatic Data Labelling for Semi-Supervised
Learning in Clinical Natural Language Processing [2.016042047576802]
放射線学報告における観測検出問題に応用した最先端の予測モデルからの不確実性推定の品質について検討する。
論文 参考訳(メタデータ) (2022-05-29T20:20:49Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Active Deep Learning on Entity Resolution by Risk Sampling [5.219701379581547]
アクティブラーニング(al)は、モデルトレーニングに有用なデータに焦点を当てた、実現可能なソリューションである。
実体解決のためのリスクサンプリング(ER)の新たなALアプローチを提案する。
ALのコアセット特性に基づいて、非一様連続性によるコアセット損失を最小限に抑える最適化モデルを理論的に導出する。
実データに対する提案手法の有効性を比較検討により実証的に検証した。
論文 参考訳(メタデータ) (2020-12-23T20:38:25Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Efficient Estimation and Evaluation of Prediction Rules in
Semi-Supervised Settings under Stratified Sampling [6.930951733450623]
本稿では,2段階の半教師付き学習(SSL)手法を提案する。
ステップIでは、非ランダムサンプリングを考慮した非線形基底関数による重み付き回帰により、欠落ラベルをインプットする。
ステップIIでは、結果の予測器の整合性を確保するために、初期計算を増強する。
論文 参考訳(メタデータ) (2020-10-19T12:54:45Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z) - Causal Inference With Selectively Deconfounded Data [22.624714904663424]
我々は、平均治療効果(ATE)を推定する際に、大規模な統合された観測データセット(共同設立者なし)と小さな非統合された観測データセット(共同設立者明らかに)を組み込むことの利点を検討する。
理論的には, 待ち行列を所望の精度で推定するために必要なデコンストラクタデータの量を大幅に削減できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-25T18:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。