論文の概要: Double/Debiased Machine Learning for Treatment and Causal Parameters
- arxiv url: http://arxiv.org/abs/1608.00060v7
- Date: Sun, 03 Nov 2024 18:37:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-17 08:33:19.160322
- Title: Double/Debiased Machine Learning for Treatment and Causal Parameters
- Title(参考訳): 治療・因果パラメータのためのダブル/デバイアス型機械学習
- Authors: Victor Chernozhukov, Denis Chetverikov, Mert Demirer, Esther Duflo, Christian Hansen, Whitney Newey, James Robins,
- Abstract要約: MLツールを介して補助予測問題を解くことにより、正規化バイアスを除去する方法を示す。
この手法は、一次および補助的予測モデルの推定に依存するため、「二重ML」と呼ばれることができる。
これにより、補助的および主予測問題の解決に、非常に広い範囲のML予測手法を使用することができる。
- 参考スコア(独自算出の注目度): 5.405360145866329
- License:
- Abstract: Most modern supervised statistical/machine learning (ML) methods are explicitly designed to solve prediction problems very well. Achieving this goal does not imply that these methods automatically deliver good estimators of causal parameters. Examples of such parameters include individual regression coefficients, average treatment effects, average lifts, and demand or supply elasticities. In fact, estimates of such causal parameters obtained via naively plugging ML estimators into estimating equations for such parameters can behave very poorly due to the regularization bias. Fortunately, this regularization bias can be removed by solving auxiliary prediction problems via ML tools. Specifically, we can form an orthogonal score for the target low-dimensional parameter by combining auxiliary and main ML predictions. The score is then used to build a de-biased estimator of the target parameter which typically will converge at the fastest possible 1/root(n) rate and be approximately unbiased and normal, and from which valid confidence intervals for these parameters of interest may be constructed. The resulting method thus could be called a "double ML" method because it relies on estimating primary and auxiliary predictive models. In order to avoid overfitting, our construction also makes use of the K-fold sample splitting, which we call cross-fitting. This allows us to use a very broad set of ML predictive methods in solving the auxiliary and main prediction problems, such as random forest, lasso, ridge, deep neural nets, boosted trees, as well as various hybrids and aggregators of these methods.
- Abstract(参考訳): 現代の統計・機械学習(ML)手法の多くは、予測問題を非常によく解くために明示的に設計されている。
この目標を達成することは、これらの手法が因果パラメータの優れた推定器を自動で提供することを意味するわけではない。
そのようなパラメータの例としては、個々の回帰係数、平均処理効果、平均リフト、需要または供給弾性がある。
実際、ML推定器を正規化バイアスにより推定方程式にナビゲートすることで得られるそのような因果パラメータの推定は、非常に不適切な振る舞いをすることができる。
幸いなことに、この正規化バイアスはMLツールを介して補助的な予測問題を解くことで取り除くことができる。
具体的には、補助的なMLと主MLの予測を組み合わせることで、対象の低次元パラメータの直交スコアを作成できる。
スコアは、通常、最も高速な1/root(n)レートで収束し、ほぼ非バイアスで正規なターゲットパラメータの非バイアス推定器を構築するために使用され、これらのパラメータに対する有効な信頼区間を構築することができる。
結果として得られた手法は、一次および補助的な予測モデルの推定に依存するため、「二重ML」と呼ばれることができる。
オーバーフィッティングを避けるため,我々は,クロスフィッティング(cross-fitting)と呼ばれる,K-foldサンプルスプリッティング(K-fold sample splitting)も利用している。
これにより、ランダムフォレスト、ラッソ、リッジ、ディープニューラルネット、ブーストツリー、およびこれらの手法の様々なハイブリッドおよびアグリゲータといった、補助的および主要な予測問題の解決に、非常に幅広いML予測手法を使用することができる。
関連論文リスト
- Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Overparameterized Multiple Linear Regression as Hyper-Curve Fitting [0.0]
線形モデルは, モデル仮定に反する非線形依存が存在する場合でも, 正確な予測を生成することが証明された。
ハイパーカーブのアプローチは、予測変数のノイズに関する問題を正規化するのに特に適しており、モデルからノイズや「不適切な」予測子を取り除くのに使うことができる。
論文 参考訳(メタデータ) (2024-04-11T15:43:11Z) - Adaptive debiased machine learning using data-driven model selection
techniques [0.5735035463793007]
Adaptive Debiased Machine Learning (ADML)は、データ駆動型モデル選択と非バイアス型機械学習技術を組み合わせた非バイアス型フレームワークである。
ADMLはモデルの誤特定によるバイアスを回避し、パラメトリックモデルとセミモデルの制約から解放される。
適応的部分線形回帰モデルにおける平均処理効果を推定するためのADML推定器の幅広いクラスを提供する。
論文 参考訳(メタデータ) (2023-07-24T06:16:17Z) - Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。
本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。
我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文 参考訳(メタデータ) (2022-09-27T07:58:25Z) - Decorrelated Variable Importance [0.0]
LOCOの修正版を定義し,相関効果を緩和する手法を提案する。
このパラメータは非パラメトリック推定が難しいが,半パラメトリックモデルを用いて推定する方法を示す。
論文 参考訳(メタデータ) (2021-11-21T16:31:36Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Nonparametric inverse probability weighted estimators based on the
highly adaptive lasso [0.966840768820136]
非パラメトリック逆確率重み付き推定器は非効率であり、次元性の呪いに苦しむことが知られている。
高度適応型ラッソのアンダースムーシングにより重み付け機構を推定する非パラメトリック逆確率重み付き推定器のクラスを提案する。
我々の開発は、大規模統計モデルと様々な問題設定における効率的な逆確率重み付き推定器の構築に幅広い意味を持つ。
論文 参考訳(メタデータ) (2020-05-22T17:49:46Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z) - Localized Debiased Machine Learning: Efficient Inference on Quantile
Treatment Effects and Beyond [69.83813153444115]
因果推論における(局所)量子化処理効果((L)QTE)の効率的な推定式を検討する。
Debiased Machine Learning (DML)は、高次元のニュアンスを推定するデータ分割手法である。
本稿では、この負担のかかるステップを避けるために、局所的脱バイアス機械学習(LDML)を提案する。
論文 参考訳(メタデータ) (2019-12-30T14:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。