論文の概要: Variational Approximations for Robust Bayesian Inference via Rho-Posteriors
- arxiv url: http://arxiv.org/abs/2601.07325v1
- Date: Mon, 12 Jan 2026 08:47:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.292976
- Title: Variational Approximations for Robust Bayesian Inference via Rho-Posteriors
- Title(参考訳): Rho-Posteriorによるロバストベイズ推論の変分近似
- Authors: EL Mahdi Khribch, Pierre Alquier,
- Abstract要約: PAC-Bayesianフレームワークは$$-posterior推論を開発した。
厳密な有限サンプル保証付き$$$-posterior推論の最初の実践的実装。
- 参考スコア(独自算出の注目度): 4.042110592015443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The $ρ$-posterior framework provides universal Bayesian estimation with explicit contamination rates and optimal convergence guarantees, but has remained computationally difficult due to an optimization over reference distributions that precludes intractable posterior computation. We develop a PAC-Bayesian framework that recovers these theoretical guarantees through temperature-dependent Gibbs posteriors, deriving finite-sample oracle inequalities with explicit rates and introducing tractable variational approximations that inherit the robustness properties of exact $ρ$-posteriors. Numerical experiments demonstrate that this approach achieves theoretical contamination rates while remaining computationally feasible, providing the first practical implementation of $ρ$-posterior inference with rigorous finite-sample guarantees.
- Abstract(参考訳): ρ$-posterior frameworkは、明示的な汚染率と最適収束保証を備えた普遍的なベイズ推定を提供するが、難解な後続計算を妨げる参照分布に対する最適化のため、計算的に困難である。
我々は,これらの理論的保証を温度依存Gibs後部から回復するPAC-Bayesianフレームワークを開発し,明示的な速度で有限サンプルのオラクル不等式を導出し,正確な$ρ$-posteriorのロバスト性を継承するトラクタブルな変動近似を導入する。
数値実験により、この手法は計算可能でありながら理論的汚染率を達成することが示され、厳密な有限サンプル保証付き$ρ$-posterior inferenceの実践的な実装となった。
関連論文リスト
- Dependent Randomized Rounding for Budget Constrained Experimental Design [18.677808169753032]
本稿では、代入確率を二項処理決定に変換するために、依存ランダム化ラウンドリング手順を適用するフレームワークを提案する。
提案手法は課題間の負の相関を誘導しながら, 限界処理確率を保ち, 分散還元による推定精度の向上を図った。
論文 参考訳(メタデータ) (2025-06-15T01:10:06Z) - Doubly-Robust Estimation of Counterfactual Policy Mean Embeddings [23.3862001690226]
反ファクトポリシーの下での成果の分配を推定することは、推薦、広告、医療といった領域における意思決定にとって重要である。
再生カーネル空間(RKHS)における反事実分布全体を表す新しいフレームワーク-Counterfactual Policy Mean Embedding(CPME)を提案する。
プラグイン推定器と2倍頑健な推定器の両方を導入し、後者は結果埋め込みモデルと確率モデルの両方においてバイアスを補正することで収束率の向上を享受する。
論文 参考訳(メタデータ) (2025-06-03T12:16:46Z) - Achieving $\widetilde{\mathcal{O}}(\sqrt{T})$ Regret in Average-Reward POMDPs with Known Observation Models [69.1820058966619]
平均逆無限水平POMDPを未知の遷移モデルで扱う。
この障壁を克服する斬新でシンプルな推定器を提示する。
論文 参考訳(メタデータ) (2025-01-30T22:29:41Z) - Confidence Interval Construction and Conditional Variance Estimation with Dense ReLU Networks [11.218066045459778]
本稿では,Rectified Linear Unit (ReLU) アクティベーション機能を持つ高密度ネットワークを用いた非パラメトリック回帰における条件分散推定と信頼区間構成の問題に対処する。
本稿では, 条件付き分散推定のための残差に基づくフレームワークを提案し, ヘテロセダスティックおよびホモセダスティックな設定下での分散推定のための漸近的境界を導出する。
本研究では,ReLUネットワークをベースとしたロバストブートストラップ手法を開発し,その適用範囲を理論的に保証し,不確実性定量化と深層学習環境における信頼性信頼区間の構築に大きく貢献する。
論文 参考訳(メタデータ) (2024-12-29T05:17:58Z) - Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Variational Refinement for Importance Sampling Using the Forward
Kullback-Leibler Divergence [77.06203118175335]
変分推論(VI)はベイズ推論における正確なサンプリングの代替として人気がある。
重要度サンプリング(IS)は、ベイズ近似推論手順の推定を微調整し、偏りを逸脱するためにしばしば用いられる。
近似ベイズ推論のための最適化手法とサンプリング手法の新たな組み合わせを提案する。
論文 参考訳(メタデータ) (2021-06-30T11:00:24Z) - Adversarial Robustness Guarantees for Gaussian Processes [22.403365399119107]
ガウス過程(GP)は、モデルの不確実性の原理的計算を可能にし、安全性に重要なアプリケーションに魅力的です。
境界付き摂動に対するモデル決定の不変性として定義されるGPの対向的堅牢性を分析するためのフレームワークを提案する。
我々は境界を洗練し、任意の$epsilon > 0$に対して、我々のアルゴリズムが有限個の反復で実際の値に$epsilon$-closeの値に収束することを保証していることを示す分岐とバウンドのスキームを開発する。
論文 参考訳(メタデータ) (2021-04-07T15:14:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。