論文の概要: Heteroscedastic sparse high-dimensional linear regression with a
partitioned empirical Bayes ECM algorithm
- arxiv url: http://arxiv.org/abs/2309.08783v2
- Date: Tue, 3 Oct 2023 01:11:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 07:21:38.076473
- Title: Heteroscedastic sparse high-dimensional linear regression with a
partitioned empirical Bayes ECM algorithm
- Title(参考訳): 分割型経験的ベイズECMアルゴリズムによるヘテロセダスティックスパース高次元線形回帰
- Authors: Anja Zgodic, Ray Bai, Jiajia Zhang, Yuan Wang, Chris Rorden, Alexander
McLain
- Abstract要約: 分割された経験的ベイズ予測最大化アルゴリズムを用いて, ヘテロセダスティックな高次元線形回帰モデルを提案する。
本研究の動機は,脳卒中患者の脳損傷の高分解能T2神経像に対する失語症クオシエント(Aphasia Quotient)に関する研究である。
- 参考スコア(独自算出の注目度): 49.504432873468254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse linear regression methods for high-dimensional data often assume that
residuals have constant variance. When this assumption is violated, it can lead
to bias in estimated coefficients, prediction intervals (PI) with improper
length, and increased type I errors. We propose a heteroscedastic
high-dimensional linear regression model through a partitioned empirical Bayes
Expectation Conditional Maximization (H-PROBE) algorithm. H-PROBE is a
computationally efficient maximum a posteriori estimation approach based on a
Parameter-Expanded Expectation-Conditional-Maximization algorithm. It requires
minimal prior assumptions on the regression parameters through plug-in
empirical Bayes estimates of hyperparameters. The variance model uses a
multivariate log-Gamma prior on coefficients that can incorporate covariates
hypothesized to impact heterogeneity. The motivation of our approach is a study
relating Aphasia Quotient (AQ) to high-resolution T2 neuroimages of brain
damage in stroke patients. AQ is a vital measure of language impairment and
informs treatment decisions, but it is challenging to measure and subject to
heteroscedastic errors. It is, therefore, of clinical importance -- and the
goal of this paper -- to use high-dimensional neuroimages to predict and
provide PIs for AQ that accurately reflect the heterogeneity in residual
variance. Our analysis demonstrates that H-PROBE can use markers of
heterogeneity to provide narrower PI widths than standard methods without
sacrificing coverage. Through extensive simulation studies, we exhibit that
H-PROBE results in superior prediction, variable selection, and predictive
inference than competing methods.
- Abstract(参考訳): 高次元データに対するスパース線形回帰法は、残差が一定の分散を持つと仮定することが多い。
この仮定に違反すると、推定係数のバイアス、不適切な長さの予測間隔(PI)、I型エラーの増加につながる可能性がある。
本研究では,H-PROBEアルゴリズムを用いた非定常高次元線形回帰モデルを提案する。
h-probeはパラメータ拡張期待条件最大化アルゴリズムに基づく計算効率のよい最大後方推定手法である。
ハイパーパラメータのプラグイン経験ベイズ推定を通じて、回帰パラメータの最小の事前仮定を必要とする。
分散モデルは係数に先立って多変量対数ガンマを使い、不均一性に影響を与えるように仮定された共変量を取り込むことができる。
脳卒中患者の脳損傷の高分解能T2ニューロン像に対するAQ(Aphasia Quotient)との関連について検討した。
AQは言語障害の重要な尺度であり、治療決定を通知するが、測定し、異義性エラーを被るのは難しい。
したがって、高次元の神経画像を用いて、残差分散の多様性を正確に反映するaqのpiを予測し提供することが臨床的に重要である。
解析の結果,H-PROBEは,ヘテロジニティのマーカーを用いて,カバー範囲を犠牲にすることなくPI幅を狭めることができることがわかった。
本研究では,H-PROBEが競合手法よりも優れた予測,変数選択,予測推論をもたらすことを示す。
関連論文リスト
- Evaluation of uncertainty estimations for Gaussian process regression based machine learning interatomic potentials [0.0]
機械学習の原子間ポテンシャルの不確実性推定は、導入した追加モデルエラーの定量化に不可欠である。
我々は、クーロンおよびSOAP表現を持つGPRモデルを、ポテンシャルエネルギー表面と分子の励起エネルギーを予測する入力として考える。
我々は,GPRの分散とアンサンブルに基づく不確かさが誤差とどのように関係しているか,また,固定された構成空間から最も不確実なサンプルを選択することによりモデル性能が向上するかを評価する。
論文 参考訳(メタデータ) (2024-10-27T10:06:09Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Efficient Normalized Conformal Prediction and Uncertainty Quantification
for Anti-Cancer Drug Sensitivity Prediction with Deep Regression Forests [0.0]
予測間隔で機械学習モデルをペアリングするための有望な方法として、コンフォーマル予測が登場した。
本研究では,深部回帰林から得られた分散度を算出し,各試料の不確かさを推定する手法を提案する。
論文 参考訳(メタデータ) (2024-02-21T19:09:53Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Beta quantile regression for robust estimation of uncertainty in the
presence of outliers [1.6377726761463862]
量子回帰(Quantile Regression)は、ディープニューラルネットワークにおけるアレタリック不確実性を推定するために用いられる。
本稿では、頑健な分散の概念を取り入れた量子レグレッションのためのロバストな解を提案する。
論文 参考訳(メタデータ) (2023-09-14T01:18:57Z) - Nonparametric Quantile Regression: Non-Crossing Constraints and
Conformal Prediction [2.654399717608053]
本稿では,線形単位ペナルティ関数を補正したディープニューラルネットワークを用いた非パラメトリック量子レグレッション法を提案し,量子交差を回避する。
提案した非パラメトリック量子化回帰関数推定器の過剰リスクに対する非漸近上界を確立する。
シミュレーション研究と実データ例を含む数値実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-10-18T20:59:48Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。