論文の概要: Evaluating Prediction Uncertainty Estimates from BatchEnsemble
- arxiv url: http://arxiv.org/abs/2601.21581v1
- Date: Thu, 29 Jan 2026 11:44:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.776881
- Title: Evaluating Prediction Uncertainty Estimates from BatchEnsemble
- Title(参考訳): BatchEnsembleによる予測不確かさの評価
- Authors: Morten Blørstad, Herman Jangsett Mostein, Nello Blaser, Pekka Parviainen,
- Abstract要約: BatchEnsembleは、不確実性推定のための汎用的でスケーラブルな方法である。
逐次モデリングのための新しいBatchEnsemble GRUセルであるGRUBEを紹介する。
GRUBEは、予測と不確実性推定の両方において、同様のまたはより良い性能を達成する。
- 参考スコア(独自算出の注目度): 2.0882560014211498
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models struggle with uncertainty estimation. Many approaches are either computationally infeasible or underestimate uncertainty. We investigate \textit{BatchEnsemble} as a general and scalable method for uncertainty estimation across both tabular and time series tasks. To extend BatchEnsemble to sequential modeling, we introduce GRUBE, a novel BatchEnsemble GRU cell. We compare the BatchEnsemble to Monte Carlo dropout and deep ensemble models. Our results show that BatchEnsemble matches the uncertainty estimation performance of deep ensembles, and clearly outperforms Monte Carlo dropout. GRUBE achieves similar or better performance in both prediction and uncertainty estimation. These findings show that BatchEnsemble and GRUBE achieve similar performance with fewer parameters and reduced training and inference time compared to traditional ensembles.
- Abstract(参考訳): ディープラーニングモデルは不確実性推定に苦労する。
多くのアプローチは計算不可能または過小評価の不確実性である。
本稿では,表と時系列のタスク間の不確実性評価のための汎用的かつスケーラブルな方法として,textit{BatchEnsemble}について検討する。
BatchEnsembleを逐次モデリングに拡張するために,新しいBatchEnsemble GRU細胞であるGRUBEを紹介する。
BatchEnsembleとMonte Carloのドロップアウトとディープアンサンブルモデルを比較した。
以上の結果から,BatchEnsembleは深いアンサンブルの不確実性推定性能と一致し,モンテカルロのドロップアウトよりも明らかに優れていた。
GRUBEは、予測と不確実性推定の両方において、同様のまたはより良い性能を達成する。
これらの結果から,BatchEnsembleとGRUBEは従来のアンサンブルと比較して,パラメータが少なく,トレーニング時間や推論時間が短縮された。
関連論文リスト
- Accuracy Law for the Future of Deep Time Series Forecasting [65.46625911002202]
時系列予測は、部分的に観測可能で不確実な性質のため、本質的にゼロでない誤差の低い境界に直面する。
本稿では、ディープ時系列予測の性能上限をどうやって推定するかという根本的な問題に焦点をあてる。
新たに訓練された2,800以上の深層予測器の厳密な統計的テストに基づいて、深部モデルの最小予測誤差とウィンドウワイズ級数パターンの複雑さとの間に有意な指数関数的関係を見出した。
論文 参考訳(メタデータ) (2025-10-03T05:18:47Z) - Post-hoc Probabilistic Vision-Language Models [54.05237186168399]
視覚言語モデル(VLM)は、分類、検索、生成タスクにおいて顕著な成功を収めている。
追加トレーニングを必要としないVLMにおけるポストホック不確実性評価を提案する。
この結果から,大規模モデルの安全性クリティカルな応用が期待できることがわかった。
論文 参考訳(メタデータ) (2024-12-08T18:16:13Z) - Better Batch for Deep Probabilistic Time Series Forecasting [15.31488551912888]
本稿では,確率的予測精度を高めるために,誤り自己相関を取り入れた新しいトレーニング手法を提案する。
本手法は,モデルトレーニングのためのD$連続時系列セグメントのコレクションとしてミニバッチを構築する。
各ミニバッチ上で時間変化の共分散行列を明示的に学習し、隣接する時間ステップ間の誤差相関を符号化する。
論文 参考訳(メタデータ) (2023-05-26T15:36:59Z) - Towards Reliable Uncertainty Quantification via Deep Ensembles in
Multi-output Regression Task [0.0]
本研究は,多出力回帰タスクにおいて,近似ベイズ推論であるディープアンサンブルアプローチについて検討することを目的とする。
増大する不確実性の過小評価の傾向を初めて観察する。
本稿では,その不確実性定量化性能を向上させるために,ポストホックキャリブレーション法を適用したディープアンサンブルフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-28T05:10:57Z) - Efficient Ensemble Model Generation for Uncertainty Estimation with
Bayesian Approximation in Segmentation [74.06904875527556]
アンサンブルセグメンテーションモデルを構築するための汎用的で効率的なセグメンテーションフレームワークを提案する。
提案手法では,層選択法を用いて効率よくアンサンブルモデルを生成することができる。
また,新たな画素単位の不確実性損失を考案し,予測性能を向上する。
論文 参考訳(メタデータ) (2020-05-21T16:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。