Fugu-MT 論文翻訳(概要): Geometric-Aware Variational Inference: Robust and Adaptive Regularization with Directional Weight Uncertainty

論文の概要: Geometric-Aware Variational Inference: Robust and Adaptive Regularization with Directional Weight Uncertainty

arxiv url: http://arxiv.org/abs/2506.19726v1
Date: Tue, 24 Jun 2025 15:42:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-25 19:48:23.702687
Title: Geometric-Aware Variational Inference: Robust and Adaptive Regularization with Directional Weight Uncertainty
Title（参考訳）: 幾何学的特徴を考慮した変分推論:方向重みの不確かさを考慮したロバストおよび適応正規化
Authors: Carlos Stein Brito,
Abstract要約: 濃度適応摂動 (CAP) は単位超球面上での重みの不確かさを直接モデル化する変分フレームワークである。 CAPは、指向性統計をニューラルネットワークの実用的なノイズ正規化に結びつける最初の完全な理論フレームワークを提供する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep neural networks require principled uncertainty quantification, yet existing variational inference methods often employ isotropic Gaussian approximations in weight space that poorly match the network's inherent geometry. We address this mismatch by introducing Concentration-Adapted Perturbations (CAP), a variational framework that models weight uncertainties directly on the unit hypersphere using von Mises-Fisher distributions. Building on recent work in radial-directional posterior decompositions and spherical weight constraints, CAP provides the first complete theoretical framework connecting directional statistics to practical noise regularization in neural networks. Our key contribution is an analytical derivation linking vMF concentration parameters to activation noise variance, enabling each layer to learn its optimal uncertainty level through a novel closed-form KL divergence regularizer. In experiments on CIFAR-10, CAP significantly improves model calibration - reducing Expected Calibration Error by 5.6x - while providing interpretable layer-wise uncertainty profiles. CAP requires minimal computational overhead and integrates seamlessly into standard architectures, offering a theoretically grounded yet practical approach to uncertainty quantification in deep learning.
Abstract（参考訳）: ディープニューラルネットワークは原理的な不確実性定量化を必要とするが、既存の変分推論法は、しばしば、ネットワーク固有の幾何学と不一致なウェイト空間における等方的ガウス近似を用いる。このミスマッチは、フォン・ミセス・フィッシャー分布を用いて、単位超球上での重みの不確かさを直接モデル化する変分フレームワークである集中適応摂動(CAP)を導入することによって解決される。近年の放射方向後部分解と球面重み制約の研究に基づいて、CAPは、指向性統計学とニューラルネットワークの実用的な雑音正規化を結合する最初の完全な理論的枠組みを提供する。我々の重要な貢献は、vMF濃度パラメータとアクティベーションノイズの分散をリンクする分析的導出であり、各層は、新しい閉形式KL分散正規化器によって最適な不確実性レベルを学習することができる。 CIFAR-10の実験では、CAPはモデル校正を大幅に改善し、期待される校正誤差を5.6倍削減した。 CAPは最小限の計算オーバーヘッドを必要とし、標準的なアーキテクチャとシームレスに統合し、理論上は基礎的だがディープラーニングにおける不確実性定量化に対する実践的なアプローチを提供する。

関連論文リスト

CLUE: Neural Networks Calibration via Learning Uncertainty-Error alignment [7.702016079410588]
CLUE(Calibration via Learning Uncertainty-Error Alignment)は,学習中の予測不確かさを観測誤差と整合させる新しい手法である。 CLUEは,最先端のアプローチに対して,キャリブレーション品質と競争予測性能に優れることを示す。
論文参考訳（メタデータ） (2025-05-28T19:23:47Z)
Scale-Insensitive Neural Network Significance Tests [0.0]
本稿では、ニューラルネットワークの重要度テストのためのスケールインセンティブなフレームワークを開発する。我々は、計量エントロピー計算をラデマッハ複雑性境界に置き換える。対象関数上の正則性条件を弱め、ソボレフ空間メンバシップのみを必要とする。
論文参考訳（メタデータ） (2025-01-27T03:45:26Z)
Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文参考訳（メタデータ） (2024-10-22T10:19:27Z)
Revisiting Essential and Nonessential Settings of Evidential Deep Learning [70.82728812001807]
Evidential Deep Learning (EDL) は不確実性推定の新しい手法である。本報告では,EDLの簡易かつ効果的な拡張型であるRe-EDLを提案する。
論文参考訳（メタデータ） (2024-10-01T04:27:07Z)
Generalized Gaussian Temporal Difference Error for Uncertainty-aware Reinforcement Learning [0.19418036471925312]
深部強化学習における一般化されたガウス誤差モデリングのための新しい枠組みを提案する。我々はデータ依存型アレタリック不確実性の推定と緩和を改善する。ポリシー勾配アルゴリズムによる実験は、大幅な性能向上を示す。
論文参考訳（メタデータ） (2024-08-05T08:12:25Z)
Alpha-VI DeepONet: A prior-robust variational Bayesian approach for enhancing DeepONets with uncertainty quantification [0.0]
一般化変分推論(GVI)を組み込んだ新しいディープオペレータネットワーク(DeepONet)を提案する。分岐ネットワークとトランクネットワークのビルディングブロックとしてベイズニューラルネットワークを組み込むことで,不確実な定量化が可能なDeepONetを実現する。変動目的関数の修正は平均二乗誤差を最小化する点で優れた結果をもたらすことを示す。
論文参考訳（メタデータ） (2024-08-01T16:22:03Z)
Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。 EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文参考訳（メタデータ） (2023-12-10T15:22:30Z)
A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文参考訳（メタデータ） (2023-11-13T01:48:08Z)
On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。理論的にも経験的にも二重降下現象を観察する。
論文参考訳（メタデータ） (2021-10-13T17:47:39Z)
Quantifying Model Predictive Uncertainty with Perturbation Theory [21.591460685054546]
本稿では,ニューラルネットワークの予測不確実性定量化のためのフレームワークを提案する。量子物理学の摂動理論を用いてモーメント分解問題を定式化する。我々の手法は、より高精度でキャリブレーションの高い高速なモデル予測不確実性推定を提供する。
論文参考訳（メタデータ） (2021-09-22T17:55:09Z)
A Kernel Framework to Quantify a Model's Local Predictive Uncertainty under Data Distributional Shifts [21.591460685054546]
訓練されたニューラルネットワークの内部層出力は、そのマッピング機能と入力データ分布の両方に関連するすべての情報を含む。生予測空間のPDFを明示的に推定する訓練ニューラルネットワークの予測不確実性定量化のためのフレームワークを提案する。カーネルフレームワークは、モデル予測エラーを検出する能力に基づいて、はるかに精度の高いモデル不確実性推定を提供する。
論文参考訳（メタデータ） (2021-03-02T00:31:53Z)
Amortized Conditional Normalized Maximum Likelihood: Reliable Out of Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文参考訳（メタデータ） (2020-11-05T08:04:34Z)
Neural Control Variates [71.42768823631918]
ニューラルネットワークの集合が、積分のよい近似を見つけるという課題に直面していることを示す。理論的に最適な分散最小化損失関数を導出し、実際に安定したオンライントレーニングを行うための代替の複合損失を提案する。具体的には、学習した光場近似が高次バウンスに十分な品質であることを示し、誤差補正を省略し、無視可能な可視バイアスのコストでノイズを劇的に低減できることを示した。
論文参考訳（メタデータ） (2020-06-02T11:17:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。