論文の概要: What Makes Forest-Based Heterogeneous Treatment Effect Estimators Work?
- arxiv url: http://arxiv.org/abs/2206.10323v2
- Date: Wed, 20 Dec 2023 14:20:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 22:37:42.456257
- Title: What Makes Forest-Based Heterogeneous Treatment Effect Estimators Work?
- Title(参考訳): 森林型不均質処理効果を推定する要因について
- Authors: Susanne Dandl and Torsten Hothorn and Heidi Seibold and Erik Sverdrup
and Stefan Wager and Achim Zeileis
- Abstract要約: 両手法がL2損失下で同じパラメータと共起仮定で理解可能であることを示す。
ランダム化環境では、両方のアプローチはベンチマーク研究で新しいブレンドバージョンと同様に実行された。
- 参考スコア(独自算出の注目度): 1.1050303097572156
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimation of heterogeneous treatment effects (HTE) is of prime importance in
many disciplines, ranging from personalized medicine to economics among many
others. Random forests have been shown to be a flexible and powerful approach
to HTE estimation in both randomized trials and observational studies. In
particular "causal forests", introduced by Athey, Tibshirani and Wager (2019),
along with the R implementation in package grf were rapidly adopted. A related
approach, called "model-based forests", that is geared towards randomized
trials and simultaneously captures effects of both prognostic and predictive
variables, was introduced by Seibold, Zeileis and Hothorn (2018) along with a
modular implementation in the R package model4you.
Here, we present a unifying view that goes beyond the theoretical motivations
and investigates which computational elements make causal forests so successful
and how these can be blended with the strengths of model-based forests. To do
so, we show that both methods can be understood in terms of the same parameters
and model assumptions for an additive model under L2 loss. This theoretical
insight allows us to implement several flavors of "model-based causal forests"
and dissect their different elements in silico.
The original causal forests and model-based forests are compared with the new
blended versions in a benchmark study exploring both randomized trials and
observational settings. In the randomized setting, both approaches performed
akin. If confounding was present in the data generating process, we found local
centering of the treatment indicator with the corresponding propensities to be
the main driver for good performance. Local centering of the outcome was less
important, and might be replaced or enhanced by simultaneous split selection
with respect to both prognostic and predictive effects.
- Abstract(参考訳): ヘテロジニアス治療効果(hte)の評価は、パーソナライズされた医療から経済学まで、多くの分野において最も重要なものである。
ランダム森林は、ランダム化試験と観測研究の両方において、HTE推定に対する柔軟で強力なアプローチであることが示されている。
Athey, Tibshirani, Wager (2019) が導入した "Causal forests" は, パッケージグラーフのR実装とともに急速に採用された。
Rパッケージモデル4youのモジュール実装とともに、Seebold、Zeileis、Hothorn (2018)によって、ランダム化試行と予測変数の効果を同時にキャプチャする「モデルベース森林」と呼ばれる関連するアプローチが導入された。
本稿では,理論的な動機を越え,どの計算要素が因果樹林を成功させるのか,モデルベース林の強みとどのように融合するかを検討する。
そこで本研究では,l2損失下の加法モデルに対して,同一パラメータとモデル仮定を用いて両手法を理解できることを示す。
この理論的な洞察により、モデルに基づく因果樹林のいくつかのフレーバーを実装し、シリコの異なる要素を識別することができる。
原生林とモデルベース林は、ランダム化試験と観測条件の両方を調査するベンチマーク研究において、新しいブレンドバージョンと比較された。
ランダムな設定では、どちらのアプローチも同じように実行された。
データ生成プロセスにコンファウンディングが存在した場合、治療指標の局所的な中心化と対応する傾向が、優れたパフォーマンスの原動力となることが分かりました。
結果の局所的な中心化は重要ではなく、予後および予測的効果の両方に関して、同時分割選択によって置き換えまたは強化される可能性がある。
関連論文リスト
- Exogenous Randomness Empowering Random Forests [4.396860522241306]
平均二乗誤差(MSE)を個々の木と森林の両方に対して非漸近展開する。
以上の結果から,サブサンプリングは個々の樹木に比べて,ランダム林の偏りや分散を減少させることが明らかとなった。
ノイズ特性の存在は、ランダムな森林の性能を高める上で「祝福」として機能する。
論文 参考訳(メタデータ) (2024-11-12T05:06:10Z) - Why do Random Forests Work? Understanding Tree Ensembles as
Self-Regularizing Adaptive Smoothers [68.76846801719095]
統計学で広く普及している偏りと分散還元に対する現在の高次二分法は、木のアンサンブルを理解するには不十分である、と我々は主張する。
森林は、通常暗黙的に絡み合っている3つの異なるメカニズムによって、樹木を改良できることを示す。
論文 参考訳(メタデータ) (2024-02-02T15:36:43Z) - Identifiable Latent Polynomial Causal Models Through the Lens of Change [82.14087963690561]
因果表現学習は、観測された低レベルデータから潜在的な高レベル因果表現を明らかにすることを目的としている。
主な課題の1つは、識別可能性(identifiability)として知られるこれらの潜伏因果モデルを特定する信頼性の高い保証を提供することである。
論文 参考訳(メタデータ) (2023-10-24T07:46:10Z) - Heterogeneous Treatment Effect Estimation for Observational Data using
Model-based Forests [0.0]
本研究では,観測データにおける不整合問題に対処するため,モデルに基づく森林の修正を提案する。
この戦略は,様々な結果分布を模擬した実験において,コンバウンディング効果を低減させることがわかった。
筋萎縮性側索硬化症の進行に対するリルゾールの潜在的ヘテロジニアス効果を評価することにより,HTEの生存率と経時的成績を推定する実践的側面を示す。
論文 参考訳(メタデータ) (2022-10-06T11:49:39Z) - FACT: High-Dimensional Random Forests Inference [4.941630596191806]
ランダム森林学習における個々の特徴の有用性の定量化は、その解釈可能性を大幅に向上させる。
既存の研究では、ランダム森林の特徴的重要度尺度が偏見の問題に悩まされていることが示されている。
本研究では, 自己正規化特徴-残留相関テスト(FACT)の枠組みを提案する。
論文 参考訳(メタデータ) (2022-07-04T19:05:08Z) - Flexible Amortized Variational Inference in qBOLD MRI [56.4324135502282]
データから酸素抽出率(OEF)と脱酸素血液量(DBV)をより明瞭に決定する。
既存の推論手法では、DBVを過大評価しながら非常にノイズの多い、過小評価されたEFマップが得られる傾向にある。
本研究は, OEFとDBVの可算分布を推定できる確率論的機械学習手法について述べる。
論文 参考訳(メタデータ) (2022-03-11T10:47:16Z) - On Uncertainty Estimation by Tree-based Surrogate Models in Sequential
Model-based Optimization [13.52611859628841]
予測不確実性推定の観点から,ランダム化木の様々なアンサンブルを再検討し,その挙動について検討する。
BwO林と呼ばれる無作為な樹木のアンサンブルを構築するための新しい手法を提案する。
実験により,既存の樹木モデルに対するBwO林の有効性と性能について様々な状況で検証した。
論文 参考訳(メタデータ) (2022-02-22T04:50:37Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Sparse Bayesian Causal Forests for Heterogeneous Treatment Effects
Estimation [0.0]
本稿では,ベイジアン因果樹林のスパース性誘導型を考案する。
観察データを用いて不均一な治療効果を推定する。
論文 参考訳(メタデータ) (2021-02-12T15:24:50Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。