論文の概要: Tree-Based Predictive Models for Noisy Input Data
- arxiv url: http://arxiv.org/abs/2603.07409v1
- Date: Sun, 08 Mar 2026 01:41:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.489173
- Title: Tree-Based Predictive Models for Noisy Input Data
- Title(参考訳): 雑音入力データに対する木に基づく予測モデル
- Authors: Kevin McCoy, Zachary Wooten, Christine B. Peterson,
- Abstract要約: 独立変数に測定誤差を直接組み込むBARTモデルの拡張である測定誤差BART(meBART)を提案する。
測定誤差が存在する場合、より正確なパラメータ推定、より堅牢な不確実性定量化、より優れた予測性能が可能であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Measurement error is prevalent across all domains of scientific research where only imprecise observations, rather than the true underlying values, can be obtained. For example, estimates of human microbiome diversity are based on small samples from a much larger, generally unobserved system and reflect both sampling error and technical variation. In high-noise settings like these, it becomes difficult to make accurate predictions and to summarize uncertainty. Methods have previously been proposed to accommodate measurement error in classic predictive models, such as linear regression. However, relatively little work has been done to address measurement error in more complex and flexible models. Bayesian additive regression trees (BART), a Bayesian nonparametric model that sums the output of many decision trees, offers robust predictions with built-in uncertainty quantification. In this work, we propose measurement error BART (meBART), a novel extension to the BART model that directly incorporates measurement error in the independent variable(s). Through simulation studies, we show that in the presence of measurement error, our model enables more accurate parameter estimation, more robust uncertainty quantification, and superior predictive performance. We illustrate the utility of our proposed approach through two biomedical applications where the predictors of interest are subject to measurement error.
- Abstract(参考訳): 測定誤差は、真の基礎となる値ではなく、不正確な観測しか得られない科学研究のすべての領域でよく見られる。
例えば、ヒトのマイクロバイオームの多様性の見積もりは、はるかに大きく、一般に観測されていないシステムの小さなサンプルに基づいており、サンプリングエラーと技術的変異の両方を反映している。
このような高雑音環境では、正確な予測を行い、不確実性を要約することは困難になる。
線形回帰のような古典的な予測モデルにおいて、測定誤差に対応する手法が提案されている。
しかし、より複雑で柔軟なモデルで測定誤差に対処する作業はほとんど行われていない。
ベイズ的加法的回帰木(Bayesian additive regression tree, BART)は、多くの決定木の出力をまとめたベイズ的非パラメトリックモデルである。
本研究では,独立変数に測定誤差を直接組み込むBARTモデルの拡張である測定誤差BART(meBART)を提案する。
シミュレーション実験により, 測定誤差の存在下では, より正確なパラメータ推定, より堅牢な不確実性定量化, 優れた予測性能が可能であることを示す。
提案手法の有効性を,興味の予測者が測定誤差を受ける2つの生体医学的応用を通して説明する。
関連論文リスト
- Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Identifiable causal inference with noisy treatment and no side information [6.432072145009342]
本研究では,不正確な連続処理変数を仮定するモデルを提案する。
我々は,提案モデルの因果効果の推定値が,側情報や測定誤差の分散に関する知識がなくても同定可能であることを証明した。
我々の研究は、信頼できる因果推論を行うアプリケーションの範囲を広げている。
論文 参考訳(メタデータ) (2023-06-18T18:38:10Z) - Robust Bayesian Inference for Berkson and Classical Measurement Error Models [9.712913056924826]
測定誤差を扱うための非パラメトリックフレームワークを提案する。
古典的誤りモデルとバークソン誤りモデルの両方に適している。
回帰モデルの種類に応じて損失関数の選択に柔軟性を提供する。
論文 参考訳(メタデータ) (2023-06-02T11:48:15Z) - High-dimensional Measurement Error Models for Lipschitz Loss [2.6415509201394283]
リプシッツ損失関数のクラスに対する高次元計測誤差モデルを開発する。
我々の推定器は、適切な実現可能な集合に属するすべての推定器の中で、$L_1$ノルムを最小化するように設計されている。
有限標本統計誤差境界と符号の整合性の観点から理論的な保証を導出する。
論文 参考訳(メタデータ) (2022-10-26T20:06:05Z) - An Investigation of Why Overparameterization Exacerbates Spurious
Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。
モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文 参考訳(メタデータ) (2020-05-09T01:59:13Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z) - Measurement Error in Nutritional Epidemiology: A Survey [0.0]
本稿では,栄養疫学分野における露出変数の測定誤差のバイアス補正モデルについてレビューする。
測定誤差の影響により, パラメータ推定は保守的であり, 傾斜パラメータの信頼区間が狭すぎる。
論文 参考訳(メタデータ) (2020-04-14T12:31:32Z) - Learning to Predict Error for MRI Reconstruction [67.76632988696943]
提案手法による予測の不確実性は予測誤差と強く相関しないことを示す。
本稿では,2段階の予測誤差の目標ラベルと大小を推定する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-02-13T15:55:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。