論文の概要: Heteroscedastic sparse high-dimensional linear regression with a
partitioned empirical Bayes ECM algorithm
- arxiv url: http://arxiv.org/abs/2309.08783v1
- Date: Fri, 15 Sep 2023 22:06:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 19:24:08.281466
- Title: Heteroscedastic sparse high-dimensional linear regression with a
partitioned empirical Bayes ECM algorithm
- Title(参考訳): 分割型経験的ベイズECMアルゴリズムによるヘテロセダスティックスパース高次元線形回帰
- Authors: Anja Zgodic, Ray Bai, Jiajia Zhang, Yuan Wang, Chris Rorden, Alexander
McLain
- Abstract要約: 本稿では, 分割型ベイズ期待条件最大化アルゴリズムを用いて, ヘテロセダスティックな高次元線形回帰モデルを提案する。
本研究の動機は,脳卒中患者の脳損傷の高分解能T2神経像に対する失語症クオシエント(Aphasia Quotient)に関する研究である。
- 参考スコア(独自算出の注目度): 49.504432873468254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse linear regression methods for high-dimensional data often assume that
residuals have constant variance. When this assumption is violated, it can lead
to bias in estimated coefficients, prediction intervals with improper length,
and increased type I errors. This paper proposes a heteroscedastic (H)
high-dimensional linear regression model through a partitioned empirical Bayes
Expectation Conditional Maximization (H-PROBE) algorithm. H-PROBE is a
computationally efficient maximum a posteriori (MAP) estimation approach based
on a Parameter-Expanded Expectation-Conditional-Maximization (PX-ECM)
algorithm. It requires minimal prior assumptions on the regression parameters
through plug-in empirical Bayes estimates of hyperparameters. The variance
model uses recent advances in multivariate log-Gamma distribution theory and
can include covariates hypothesized to impact heterogeneity. The motivation of
our approach is a study relating Aphasia Quotient (AQ) to high-resolution T2
neuroimages of brain damage in stroke patients. AQ is a vital measure of
language impairment and informs treatment decisions, but it is challenging to
measure and subject to heteroscedastic errors. As a result, it is of clinical
importance -- and the goal of this paper -- to use high-dimensional neuroimages
to predict and provide prediction intervals for AQ that accurately reflect the
heterogeneity in the residual variance. Our analysis demonstrates that H-PROBE
can use markers of heterogeneity to provide prediction interval widths that are
narrower than standard methods without sacrificing coverage. Further, through
extensive simulation studies, we exhibit that the proposed approach results in
superior prediction, variable selection, and predictive inference than
competing methods.
- Abstract(参考訳): 高次元データに対するスパース線形回帰法は、残差が一定の分散を持つと仮定することが多い。
この仮定が破られた場合、推定係数のバイアス、不適切な長さの予測間隔、I型エラーの増加につながる可能性がある。
本稿では,H-PROBE(H-PROBE)アルゴリズムを分割した経験的ベイズ予測条件付き回帰モデルを提案する。
H-PROBE はパラメータ拡張期待-決定-最大化(PX-ECM)アルゴリズムに基づく計算効率のよい最大値推定手法である。
ハイパーパラメータのプラグイン経験ベイズ推定を通じて、回帰パラメータの最小の事前仮定を必要とする。
分散モデルは、多変量対ガンマ分布論の最近の進歩を利用し、不均一性に影響を与えると仮定された共変量を含むことができる。
脳卒中患者の脳損傷の高分解能T2ニューロン像に対するAQ(Aphasia Quotient)との関連について検討した。
AQは言語障害の重要な尺度であり、治療決定を通知するが、測定し、異義性エラーを被るのは難しい。
その結果、高次元神経画像を用いて残差の不均一性を正確に反映したAQの予測間隔を予測および提供することが臨床的に重要であり、本論文の目的である。
以上の結果から,h-probeは不均一性のマーカーを用いて,標準法よりも狭い区間幅を予測できることを示した。
さらに, シミュレーション実験により, 提案手法が競合手法よりも優れた予測, 変数選択, 予測推論をもたらすことを示した。
関連論文リスト
- Evaluation of uncertainty estimations for Gaussian process regression based machine learning interatomic potentials [0.0]
機械学習の原子間ポテンシャルの不確実性推定は、導入した追加モデルエラーの定量化に不可欠である。
我々は、クーロンおよびSOAP表現を持つGPRモデルを、ポテンシャルエネルギー表面と分子の励起エネルギーを予測する入力として考える。
我々は,GPRの分散とアンサンブルに基づく不確かさが誤差とどのように関係しているか,また,固定された構成空間から最も不確実なサンプルを選択することによりモデル性能が向上するかを評価する。
論文 参考訳(メタデータ) (2024-10-27T10:06:09Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Efficient Normalized Conformal Prediction and Uncertainty Quantification
for Anti-Cancer Drug Sensitivity Prediction with Deep Regression Forests [0.0]
予測間隔で機械学習モデルをペアリングするための有望な方法として、コンフォーマル予測が登場した。
本研究では,深部回帰林から得られた分散度を算出し,各試料の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2024-02-21T19:09:53Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Beta quantile regression for robust estimation of uncertainty in the
presence of outliers [1.6377726761463862]
量子回帰(Quantile Regression)は、ディープニューラルネットワークにおけるアレタリック不確実性を推定するために用いられる。
本稿では、頑健な分散の概念を取り入れた量子レグレッションのためのロバストな解を提案する。
論文 参考訳(メタデータ) (2023-09-14T01:18:57Z) - Nonparametric Quantile Regression: Non-Crossing Constraints and
Conformal Prediction [2.654399717608053]
本稿では,線形単位ペナルティ関数を補正したディープニューラルネットワークを用いた非パラメトリック量子レグレッション法を提案し,量子交差を回避する。
提案した非パラメトリック量子化回帰関数推定器の過剰リスクに対する非漸近上界を確立する。
シミュレーション研究と実データ例を含む数値実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-10-18T20:59:48Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。