論文の概要: Double Machine Learning for Static Panel Models with Fixed Effects
- arxiv url: http://arxiv.org/abs/2312.08174v1
- Date: Wed, 13 Dec 2023 14:34:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-14 15:11:36.984890
- Title: Double Machine Learning for Static Panel Models with Fixed Effects
- Title(参考訳): 固定効果を有する静的パネルモデルのダブル機械学習
- Authors: Paul Clarke, Annalivia Polselli
- Abstract要約: コンバウンディング・レグレッショナーの非線形効果を許容する政策介入の推定器を開発する。
モンテカルロシミュレーションを用いて、データ生成プロセスが非線形であっても、従来の最小二乗推定器は良好に動作可能であることを示す。
英国における国民最低賃金の影響を示す観測パネルデータに対するDMLの例を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine Learning (ML) algorithms are powerful data-driven tools for
approximating high-dimensional or non-linear nuisance functions which are
useful in practice because the true functional form of the predictors is
ex-ante unknown. In this paper, we develop estimators of policy interventions
from panel data which allow for non-linear effects of the confounding
regressors, and investigate the performance of these estimators using three
well-known ML algorithms, specifically, LASSO, classification and regression
trees, and random forests. We use Double Machine Learning (DML) (Chernozhukov
et al., 2018) for the estimation of causal effects of homogeneous treatments
with unobserved individual heterogeneity (fixed effects) and no unobserved
confounding by extending Robinson (1988)'s partially linear regression model.
We develop three alternative approaches for handling unobserved individual
heterogeneity based on extending the within-group estimator, first-difference
estimator, and correlated random effect estimator (Mundlak, 1978) for
non-linear models. Using Monte Carlo simulations, we find that conventional
least squares estimators can perform well even if the data generating process
is non-linear, but there are substantial performance gains in terms of bias
reduction under a process where the true effect of the regressors is non-linear
and discontinuous. However, for the same scenarios, we also find -- despite
extensive hyperparameter tuning -- inference to be problematic for both
tree-based learners because these lead to highly non-normal estimator
distributions and the estimator variance being severely under-estimated. This
contradicts the performance of trees in other circumstances and requires
further investigation. Finally, we provide an illustrative example of DML for
observational panel data showing the impact of the introduction of the national
minimum wage in the UK.
- Abstract(参考訳): 機械学習(ML)アルゴリズムは、予測子の真の機能形式が未知であるため、実際に有用な高次元または非線形ニュアンス関数を近似するための強力なデータ駆動ツールである。
本稿では,集合レグレッサの非線形効果を許容するパネルデータからの政策介入の推定器を開発し,これら推定器の性能について,ラスソ,分類・回帰木,ランダム林の3つのよく知られたmlアルゴリズムを用いて検討する。
我々はDouble Machine Learning (DML) (Chernozhukov et al., 2018) を用いて、不均一な個々の不均一性(固定効果)と、Robinson (1988) の部分的に線形回帰モデルを拡張することによる不均一な共振の因果効果を推定する。
非線形モデルに対するグループ内推定器,ファーストディファレンス推定器,相関付きランダム効果推定器(mundlak,1978)の拡張に基づく,観測不能な個人不均一性を扱うための3つの方法を開発した。
モンテカルロシミュレーションを用いて、データ生成プロセスが非線形であっても従来の最小二乗推定器は良好に動作可能であるが、回帰器の真の効果が非線形で不連続なプロセスではバイアス低減の点でかなりの性能向上がある。
しかし、同じシナリオでは、広範なハイパーパラメータチューニングにもかかわらず、これらが極めて非正規な推定値分布をもたらし、推定値の分散が著しく過小評価されているため、両方の学習者にとって問題となる。
これは他の状況での樹木のパフォーマンスと矛盾し、さらなる調査が必要である。
最後に、英国における全国最低賃金導入の影響を示す観測パネルデータに対するDMLの例を示す。
関連論文リスト
- Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - PairCFR: Enhancing Model Training on Paired Counterfactually Augmented Data through Contrastive Learning [49.60634126342945]
Counterfactually Augmented Data (CAD)は、既存のデータサンプルのラベルを他のクラスに戻すのに、最小限かつ十分な修正を適用することで、新しいデータサンプルを作成する。
近年の研究では、CADを用いたトレーニングが、他の重要な文脈情報を無視しながら、モデルが修正機能に過度にフォーカスする可能性があることが示されている。
我々は、対実的手がかりの学習に加えて、グローバルな特徴アライメントを促進するために、対照的な学習を採用する。
論文 参考訳(メタデータ) (2024-06-09T07:29:55Z) - Neural Networks with Causal Graph Constraints: A New Approach for Treatment Effects Estimation [0.951494089949975]
因果グラフからの追加情報を考慮した新しいモデルNN-CGCを提案する。
本手法は因果グラフの不完全性に対して頑健であり,部分因果情報の使用は無視するよりも望ましいことを示す。
論文 参考訳(メタデータ) (2024-04-18T14:57:17Z) - Estimating Causal Effects with Double Machine Learning -- A Method Evaluation [5.904095466127043]
DML(Double/Debiased Machine Learning)の最も顕著な手法の1つについてレビューする。
この結果から, DML 内でのフレキシブルな機械学習アルゴリズムの適用により, 様々な非線形共起関係の調整が向上することが示唆された。
大気汚染が住宅価格に与える影響を推定すると、DMLの見積もりは柔軟性の低い方法の推定よりも一貫して大きいことが分かる。
論文 参考訳(メタデータ) (2024-03-21T13:21:33Z) - Understanding Influence Functions and Datamodels via Harmonic Analysis [36.86262318584668]
個々のデータポイントがテストデータに対するモデルの予測に与える影響を推定する。
それらは、データ中毒の検出、有用で有害な例の検出、データポイントのグループの影響などに使われる。
近年、Ilyasら[2022]は、データモデルと呼ばれる線形回帰手法を導入し、テストデータに対するトレーニングポイントの効果を予測した。
本稿では,このような興味深い経験的現象の理論的理解を深めることを目的とする。
論文 参考訳(メタデータ) (2022-10-03T16:45:33Z) - How robust are pre-trained models to distribution shift? [82.08946007821184]
自己教師付き学習(SSL)と自己エンコーダベースモデル(AE)の相互関係が相互関係に与える影響を示す。
本研究では, 線形ヘッドの潜在バイアスから事前学習したモデルの性能を分離するために, アウト・オブ・ディストリビューション(OOD)データに基づいて訓練された線形ヘッドを用いた新しい評価手法を開発した。
論文 参考訳(メタデータ) (2022-06-17T16:18:28Z) - Learning from few examples with nonlinear feature maps [68.8204255655161]
我々はこの現象を探求し、AIモデルの特徴空間の次元性、データ分散の非退化、モデルの一般化能力の間の重要な関係を明らかにする。
本分析の主な推力は、元のデータを高次元および無限次元空間にマッピングする非線形特徴変換が結果のモデル一般化能力に与える影響である。
論文 参考訳(メタデータ) (2022-03-31T10:36:50Z) - Efficient Causal Inference from Combined Observational and
Interventional Data through Causal Reductions [68.6505592770171]
因果効果を推定する際の主な課題の1つである。
そこで本研究では,任意の数の高次元潜入共創者を置き換える新たな因果還元法を提案する。
パラメータ化縮小モデルを観測データと介入データから共同で推定する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T14:29:07Z) - Differentially Private ERM Based on Data Perturbation [41.37436071802578]
最終学習モデルにおける各種トレーニングデータインスタンスのコントリビューションを測定した。
本手法の鍵は各データインスタンスを別々に計測することであり,DP-ERMのための新しいデータ摂動(DB)パラダイムを提案する。
論文 参考訳(メタデータ) (2020-02-20T06:05:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。