論文の概要: An evaluation framework for comparing causal inference models
- arxiv url: http://arxiv.org/abs/2209.00115v1
- Date: Wed, 31 Aug 2022 21:04:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 13:33:42.797093
- Title: An evaluation framework for comparing causal inference models
- Title(参考訳): 因果推論モデルの比較のための評価フレームワーク
- Authors: Niki Kiriakidou, Christos Diou
- Abstract要約: 提案手法を用いて、いくつかの最先端因果効果推定モデルを比較した。
このアプローチの背後にある主な動機は、少数のインスタンスやシミュレーションがベンチマークプロセスに与える影響を取り除くことである。
- 参考スコア(独自算出の注目度): 3.1372269816123994
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Estimation of causal effects is the core objective of many scientific
disciplines. However, it remains a challenging task, especially when the
effects are estimated from observational data. Recently, several promising
machine learning models have been proposed for causal effect estimation. The
evaluation of these models has been based on the mean values of the error of
the Average Treatment Effect (ATE) as well as of the Precision in Estimation of
Heterogeneous Effect (PEHE). In this paper, we propose to complement the
evaluation of causal inference models using concrete statistical evidence,
including the performance profiles of Dolan and Mor{\'e}, as well as
non-parametric and post-hoc statistical tests. The main motivation behind this
approach is the elimination of the influence of a small number of instances or
simulation on the benchmarking process, which in some cases dominate the
results. We use the proposed evaluation methodology to compare several
state-of-the-art causal effect estimation models.
- Abstract(参考訳): 因果効果の推定は多くの科学分野の中核的な目的である。
しかし、特に観測データから効果が推定される場合、これは難しい課題である。
近年,因果効果推定のための機械学習モデルがいくつか提案されている。
これらのモデルの評価は、平均処理効果(ATE)の誤差の平均値と、不均質効果(PEHE)の推定精度に基づいている。
本稿では,dolan と mor{\e} のパフォーマンスプロファイルや非パラメトリックおよびポストホックな統計テストなど,具体的な統計的証拠を用いた因果推論モデルの評価を補完する。
このアプローチの背後にある主な動機は、少数のインスタンスやシミュレーションがベンチマークプロセスに与える影響を取り除くことである。
提案手法を用いた因果効果推定モデルの比較を行った。
関連論文リスト
- Causal Fine-Tuning and Effect Calibration of Non-Causal Predictive Models [1.3124513975412255]
本稿では,無作為な実験データを用いた因果推論のための非因果モデルの性能向上手法を提案する。
広告、顧客の保持、精密医療のような領域では、介入なしの結果を予測する非因果モデルはしばしば、介入の期待された効果に応じて個人をスコアしランク付けするために使用される。
論文 参考訳(メタデータ) (2024-06-13T20:18:16Z) - C-XGBoost: A tree boosting model for causal effect estimation [8.246161706153805]
因果効果推定は、平均処理効果と、治療の条件平均処理効果を、利用可能なデータから得られる結果に推定することを目的としている。
本稿では,C-XGBoost という新たな因果推論モデルを提案する。
論文 参考訳(メタデータ) (2024-03-31T17:43:37Z) - Estimating Causal Effects with Double Machine Learning -- A Method Evaluation [5.904095466127043]
DML(Double/Debiased Machine Learning)の最も顕著な手法の1つについてレビューする。
この結果から, DML 内でのフレキシブルな機械学習アルゴリズムの適用により, 様々な非線形共起関係の調整が向上することが示唆された。
大気汚染が住宅価格に与える影響を推定すると、DMLの見積もりは柔軟性の低い方法の推定よりも一貫して大きいことが分かる。
論文 参考訳(メタデータ) (2024-03-21T13:21:33Z) - Benchmarking Bayesian Causal Discovery Methods for Downstream Treatment
Effect Estimation [137.3520153445413]
下流推論に重点を置く因果発見手法の評価において,顕著なギャップが存在する。
我々は,GFlowNetsに基づく新たな手法を含む,確立された7つの基本因果探索手法を評価する。
研究の結果,研究対象のアルゴリズムのいくつかは,多種多様なATEモードを効果的に捉えることができることがわかった。
論文 参考訳(メタデータ) (2023-07-11T02:58:10Z) - Hyperparameter Tuning and Model Evaluation in Causal Effect Estimation [2.7823528791601686]
本稿では,因果効果推定のためのモデル評価の4つの異なる側面間の相互作用について検討する。
ほとんどの因果推定器は、十分に調整された場合、ほぼ同等の性能であることがわかった。
我々は,現在,最先端の手順で提供されていない最適性能を解き放つために,因果モデル評価に関するさらなる研究を求めている。
論文 参考訳(メタデータ) (2023-03-02T17:03:02Z) - Data-Driven Estimation of Heterogeneous Treatment Effects [15.140272661540655]
異種治療効果推定(ヘテロジニアス・エフェクト・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント・アセスメント)は、経験科学において重要な問題である。
機械学習を用いた不均一な処理効果推定のための最先端データ駆動手法について調査する。
論文 参考訳(メタデータ) (2023-01-16T21:36:49Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Measuring Causal Effects of Data Statistics on Language Model's
`Factual' Predictions [59.284907093349425]
大量のトレーニングデータが、最先端のNLPモデルの高性能化の大きな理由の1つである。
トレーニングデータがどのように予測に影響を及ぼすかを記述するための言語を,因果的フレームワークを通じて提供する。
我々のフレームワークは、高価なモデルの再訓練の必要性を回避し、観測データのみに基づいて因果効果を推定することができる。
論文 参考訳(メタデータ) (2022-07-28T17:36:24Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。