論文の概要: Meta-Analysis with Untrusted Data
- arxiv url: http://arxiv.org/abs/2407.09387v1
- Date: Fri, 12 Jul 2024 16:07:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-15 22:48:56.063730
- Title: Meta-Analysis with Untrusted Data
- Title(参考訳): 信頼できないデータを用いたメタ分析
- Authors: Shiva Kaul, Geoffrey J. Gordon,
- Abstract要約: メタアナリシスに2つの変更を加えることで、因果的疑問にもっと正確に答える方法を示す。
まず,大規模観測データベースから引き出された信頼できないデータを組み込む。
第二に、不均一な試行を扱うことができるよりリッチなモデルを訓練する。
- 参考スコア(独自算出の注目度): 14.28797726638936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: [See paper for full abstract] Meta-analysis is a crucial tool for answering scientific questions. It is usually conducted on a relatively small amount of ``trusted'' data -- ideally from randomized, controlled trials -- which allow causal effects to be reliably estimated with minimal assumptions. We show how to answer causal questions much more precisely by making two changes. First, we incorporate untrusted data drawn from large observational databases, related scientific literature and practical experience -- without sacrificing rigor or introducing strong assumptions. Second, we train richer models capable of handling heterogeneous trials, addressing a long-standing challenge in meta-analysis. Our approach is based on conformal prediction, which fundamentally produces rigorous prediction intervals, but doesn't handle indirect observations: in meta-analysis, we observe only noisy effects due to the limited number of participants in each trial. To handle noise, we develop a simple, efficient version of fully-conformal kernel ridge regression, based on a novel condition called idiocentricity. We introduce noise-correcting terms in the residuals and analyze their interaction with a ``variance shaving'' technique. In multiple experiments on healthcare datasets, our algorithms deliver tighter, sounder intervals than traditional ones. This paper charts a new course for meta-analysis and evidence-based medicine, where heterogeneity and untrusted data are embraced for more nuanced and precise predictions.
- Abstract(参考訳): メタアナリシス(メタアナリシス)は科学的な疑問に答えるための重要なツールです。
通常、最小限の仮定で因果効果を確実に推定できる「信頼された」データの比較的少ない量(理想的にはランダム化され、制御された試行から)で実行される。
2つの変更をすることで、因果的疑問にもっと正確に答える方法を示します。
まず、大規模な観測データベース、関連する科学文献、実践経験から引き出された信頼できないデータを、厳密さを犠牲にしたり、強い仮定を導入したりすることなく組み込んだ。
第2に、異質な試行を扱えるリッチなモデルをトレーニングし、メタ分析における長年の課題に対処する。
提案手法は,厳密な予測間隔を基本的に生成するが,間接的な観察は行わない共形予測に基づいており,メタ分析では,各試験の参加者数の制限によるノイズ効果のみを観察する。
ノイズに対処するため,イディオセントリティーと呼ばれる新しい条件に基づいて,完全整形カーネルリッジ回帰の簡易かつ効率的なバージョンを開発した。
残響における雑音補正用語を導入し,その相互作用を「ばらつきシェービング」手法で解析する。
医療データセットに関する複数の実験において、我々のアルゴリズムは従来のものよりも厳密で、より健全な間隔を提供する。
本稿では, 異質性や信頼できないデータが, より微妙で正確な予測のために取り入れられる, メタアナリシスとエビデンスに基づく医学の新しいコースを示す。
関連論文リスト
- Selective Inference for Time-Varying Effect Moderation [3.8233569758620063]
因果効果のモデレーションは、個人が観察した特性に基づいて、結果変数に対する介入(または治療)の効果がどのように変化するかを調べる。
高次元解析は、しばしば解釈可能性に欠け、重要なモデレーターはノイズに隠れている。
時間変化による因果効果のモデレーションを選択的に推定する2段階の手法を提案する。
論文 参考訳(メタデータ) (2024-11-24T16:37:48Z) - High-dimensional logistic regression with missing data: Imputation, regularization, and universality [7.167672851569787]
我々は高次元リッジ規則化ロジスティック回帰について検討する。
予測誤差と推定誤差の両方を正確に評価する。
論文 参考訳(メタデータ) (2024-10-01T21:41:21Z) - Debiasing Machine Learning Models by Using Weakly Supervised Learning [3.3298048942057523]
アルゴリズムの出力と感度変数の両方が連続的な設定において、アルゴリズム決定のバイアス軽減の問題に取り組む。
典型的な例は、年齢や財政状況に関して行われる不公平な決定である。
我々のバイアス緩和戦略は弱い教師付き学習手法であり、データのごく一部を公平に測定する必要がある。
論文 参考訳(メタデータ) (2024-02-23T18:11:32Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Calibration of prediction rules for life-time outcomes using prognostic
Cox regression survival models and multiple imputations to account for
missing predictor data with cross-validatory assessment [0.0]
検閲対象の生存モデルにおけるインプテーションと予測キャリブレーションを組み合わせた手法について述べる。
予測平均化は、ルービンの規則の直接適用とは対照的に、優れた統計的特性、特により小さい予測的変化を有するように見える。
論文 参考訳(メタデータ) (2021-05-04T20:10:12Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - An Investigation of Why Overparameterization Exacerbates Spurious
Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。
モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文 参考訳(メタデータ) (2020-05-09T01:59:13Z) - MissDeepCausal: Causal Inference from Incomplete Data Using Deep Latent
Variable Models [14.173184309520453]
因果推論の最先端の手法は、欠落した値を考慮していない。
欠落したデータは、適応された未確立仮説を必要とする。
欠落した値に適応した変分オートエンコーダを通じて分布を学習する潜在的共同設立者について考察する。
論文 参考訳(メタデータ) (2020-02-25T12:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。