論文の概要: A Fast Bootstrap Algorithm for Causal Inference with Large Data
- arxiv url: http://arxiv.org/abs/2302.02859v1
- Date: Mon, 6 Feb 2023 15:26:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 16:20:55.722847
- Title: A Fast Bootstrap Algorithm for Causal Inference with Large Data
- Title(参考訳): 大規模データを用いた因果推論のための高速ブートストラップアルゴリズム
- Authors: Matthew Kosko and Lin Wang and Michele Santacatterina
- Abstract要約: ブートストラップは直感的で強力な手法であり、推定器の標準誤差と信頼区間を構築するのに使用される。
機械学習と最適化技術に基づく現代の因果推論推定器はブートストラップの計算負担を悪化させる。
小さいブートストラップの袋は、大規模データに対する非因果的な設定で提案されているが、因果効果の推定器の特性を評価するには、まだ適用されていない。
- 参考スコア(独自算出の注目度): 5.1236236055569195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating causal effects from large experimental and observational data has
become increasingly prevalent in both industry and research. The bootstrap is
an intuitive and powerful technique used to construct standard errors and
confidence intervals of estimators. Its application however can be
prohibitively demanding in settings involving large data. In addition, modern
causal inference estimators based on machine learning and optimization
techniques exacerbate the computational burden of the bootstrap. The bag of
little bootstraps has been proposed in non-causal settings for large data but
has not yet been applied to evaluate the properties of estimators of causal
effects. In this paper, we introduce a new bootstrap algorithm called causal
bag of little bootstraps for causal inference with large data. The new
algorithm significantly improves the computational efficiency of the
traditional bootstrap while providing consistent estimates and desirable
confidence interval coverage. We describe its properties, provide practical
considerations, and evaluate the performance of the proposed algorithm in terms
of bias, coverage of the true 95% confidence intervals, and computational time
in a simulation study. We apply it in the evaluation of the effect of hormone
therapy on the average time to coronary heart disease using a large
observational data set from the Women's Health Initiative.
- Abstract(参考訳): 大規模実験データと観測データから因果効果を推定することは、産業と研究の両方でますます普及している。
ブートストラップは直感的で強力な手法であり、推定器の標準誤差と信頼区間を構築するのに使用される。
しかし、大規模なデータを含む設定では、そのアプリケーションは違法に要求される可能性がある。
さらに、機械学習と最適化技術に基づく現代の因果推定器は、ブートストラップの計算負担を悪化させる。
小さなブートストラップの袋は、大規模データの非因果的設定で提案されているが、因果効果の推定器の特性を評価するためにはまだ適用されていない。
本稿では,大規模データを用いた因果推論のために,小さなブートストラップの因果袋と呼ばれる新しいブートストラップアルゴリズムを提案する。
この新しいアルゴリズムは従来のブートストラップの計算効率を大幅に向上させ、一貫した推定と望ましい信頼区間カバレッジを提供する。
シミュレーション実験において,その特性を記述し,実用的な考察を行い,バイアス,真の95%信頼区間のカバレッジ,計算時間の観点から提案アルゴリズムの性能を評価する。
本研究は,女性の健康イニシアチブから収集した大規模観察データを用いて,冠動脈疾患に対するホルモン療法の効果を平均時間に及ぼす影響について検討した。
関連論文リスト
- Estimating Causal Effects with Double Machine Learning -- A Method Evaluation [5.904095466127043]
DML(Double/Debiased Machine Learning)の最も顕著な手法の1つについてレビューする。
この結果から, DML 内でのフレキシブルな機械学習アルゴリズムの適用により, 様々な非線形共起関係の調整が向上することが示唆された。
大気汚染が住宅価格に与える影響を推定すると、DMLの見積もりは柔軟性の低い方法の推定よりも一貫して大きいことが分かる。
論文 参考訳(メタデータ) (2024-03-21T13:21:33Z) - An Online Bootstrap for Time Series [0.27195102129094995]
本稿では,データ依存を考慮し,オンラインで実行できるブートストラップ手法を提案する。
一般条件下でのブートストラップ方式の理論的妥当性を検証した。
我々の研究は、古典的な再サンプリング技術と現代のデータ分析の要求のギャップを埋めるものです。
論文 参考訳(メタデータ) (2023-10-30T16:03:11Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Re-thinking Data Availablity Attacks Against Deep Neural Networks [53.64624167867274]
本稿では、未学習例の概念を再検討し、既存のロバストな誤り最小化ノイズが不正確な最適化目標であることを示す。
本稿では,計算時間要件の低減による保護性能の向上を図った新しい最適化パラダイムを提案する。
論文 参考訳(メタデータ) (2023-05-18T04:03:51Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Reliable Probability Intervals For Classification Using Inductive Venn
Predictors Based on Distance Learning [2.66512000865131]
Inductive Venn Predictors framework を用いて,各予測の正確性に関する確率区間をリアルタイムに計算する。
本稿では,高次元入力を含むアプリケーションにおける情報伝達確率区間を計算するための距離距離距離学習法を提案する。
論文 参考訳(メタデータ) (2021-10-07T00:51:43Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Bayesian Active Learning for Wearable Stress and Affect Detection [0.7106986689736827]
デバイス上での深層学習アルゴリズムによるストレス検出は、広汎なコンピューティングの進歩により増加傾向にある。
本稿では,ベイズニューラルネットワークの近似によるモデル不確実性を表現可能なフレームワークを提案する。
提案手法は, 提案手法により, 推定時の効率を著しく向上し, 獲得したプール点数がかなり少なくなる。
論文 参考訳(メタデータ) (2020-12-04T16:19:37Z) - A comparison of Monte Carlo dropout and bootstrap aggregation on the
performance and uncertainty estimation in radiation therapy dose prediction
with deep learning neural networks [0.46180371154032895]
本稿では,モンテカルロ投棄法(MCDO)とブートストラップアグリゲーション(バッグング)をディープラーニングモデルに応用し,放射線治療用線量予測の不確かさを推定する手法を提案する。
パフォーマンス面では、バギングは調査対象のほとんどの指標において統計的に顕著な損失値と誤差を減少させる。
論文 参考訳(メタデータ) (2020-11-01T00:24:43Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。