論文の概要: Conservative neural posterior estimation via distributionally robust training
- arxiv url: http://arxiv.org/abs/2605.28516v1
- Date: Wed, 27 May 2026 14:17:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.103788
- Title: Conservative neural posterior estimation via distributionally robust training
- Title(参考訳): 分布的ロバストトレーニングによる保存的神経後部推定
- Authors: William Laplante, Yuga Hikida, Charita Dellaporta, François-Xavier Briol, Ayush Bharti,
- Abstract要約: 神経後部推定(NPE)によるシミュレーションベース推論は、限られたシミュレーション予算の下では、過信と信頼できない後部を生じることが多い。
DRO-NPEは、標準的なNPEの目的をワッサーシュタインの曖昧さに対する最悪の損失に置き換える、分布的に堅牢なアプローチである。
- 参考スコア(独自算出の注目度): 7.518353033345929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulation-based inference with neural posterior estimation (NPE) often yields overconfident and unreliable posteriors under limited simulation budgets. To address this, we propose DRO-NPE, a distributionally robust approach that replaces the standard NPE objective with a worst-case loss over a Wasserstein ambiguity set. We introduce KL-based metrics for miscoverage and miscalibration, and use these to show that the DRO-NPE objective controls overfitting and reduces posterior overconfidence. Our method is tractable, parallelisable, and readily integrates with standard normalising flows. Across benchmark SBI tasks, DRO-NPE consistently improves coverage and calibration, while narrowing the gap between empirical and population NPE loss, leading to more reliable inference in low-simulation regimes.
- Abstract(参考訳): 神経後部推定(NPE)によるシミュレーションベース推論は、限られたシミュレーション予算の下では、過信と信頼できない後部を生じることが多い。
そこで本稿では,標準的なNPEの目的をワッサーシュタインの曖昧性集合上の最悪の損失に置き換える分散ロバストなアプローチであるDRO-NPEを提案する。
我々は,誤発見と誤校正のためのKLベースのメトリクスを導入し,DRO-NPEの目的が過度に適合し,後方過信を減少させることを示す。
提案手法は, トラクタブルで並列性があり, 標準正規化フローと容易に統合できる。
ベンチマークSBIタスク全体では、DRO-NPEはカバーとキャリブレーションを継続的に改善し、経験的NPE損失と人口的NPE損失のギャップを狭める。
関連論文リスト
- Ratio-Variance Regularized Policy Optimization [64.95520246570446]
ポリシ比の分散を明示的に制約することは、信頼領域の制約に対する原則的な局所近似をもたらすことを示す。
本稿では,この制約を実装したR2bf VPO$(Ratio-Variance Regularized Policy Optimization)を紹介する。
論文 参考訳(メタデータ) (2026-05-26T09:53:42Z) - Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - Robust Transfer Learning with Side Information [14.10618869312116]
本研究では,推定中心の不確実性セットを介し,ロバストなターゲットドメインポリシーを導出する環境シフト下での移動のためのフレームワークを提案する。
サイド情報には、特徴モーメント、分布距離、密度比のバウンダリが含まれている。
学習されたロバストポリシーに対する有限サンプル保証を提供し、ロバストな準最適ギャップを分析する。
論文 参考訳(メタデータ) (2026-03-09T03:29:44Z) - KD-EKF: Knowledge-Distilled Adaptive Covariance EKF for Robust UWB/PDR Indoor Localization [6.004649968619912]
屋内でのローカライゼーションは、センチメートルレベルの精度と低レイテンシを提供する。
非視界条件下では測定信頼性が著しく低下する。
慣性測定ユニット(IMU)をベースとしたPDR(Pedestrian Dead Reckoning)は,インフラストラクチャフリーな動作推定を提供する。
論文 参考訳(メタデータ) (2026-03-06T03:12:52Z) - Minimum Distance Summaries for Robust Neural Posterior Estimation [7.4716500353679685]
シミュレーションベース推論(SBI)は、前シミュレーションペア上で神経後部推定器(NPE)をトレーニングすることで、償却ベイズ推論を可能にする。
プリミティブ・ディスタンス・サマリー(minimum-distance summaries)は,プレトレーニング済みのNPEとは独立に,クエリされたテスト時間サマリーを適応するプラグイン・ロバストなNPE手法である。
論文 参考訳(メタデータ) (2026-02-09T20:06:15Z) - RDIT: Residual-based Diffusion Implicit Models for Probabilistic Time Series Forecasting [4.140149411004857]
RDITは、点推定と残差に基づく条件拡散と双方向のMambaネットワークを組み合わせたプラグアンドプレイフレームワークである。
RDITは, 強いベースラインに比べてCRPSの低下, 高速推論, カバレッジの向上を実現している。
論文 参考訳(メタデータ) (2025-09-02T14:06:29Z) - Distributionally Robust Optimization with Adversarial Data Contamination [49.89480853499918]
凸リプシッツ損失関数を持つ一般化線形モデルに対するワッサーシュタイン-1 DRO 目標の最適化に焦点をあてる。
私たちの主な貢献は、データ汚染のトレーニングに対するロバストネスと分散シフトに対するロバストネスを統合した、新しいモデリングフレームワークです。
この研究は、データ汚染と分散シフトという2つの課題の下で学習するために、効率的な計算によって支援される最初の厳密な保証を確立する。
論文 参考訳(メタデータ) (2025-07-14T18:34:10Z) - Model-Based Epistemic Variance of Values for Risk-Aware Policy Optimization [59.758009422067]
モデルベース強化学習における累積報酬に対する不確実性を定量化する問題を考察する。
我々は、解が値の真後分散に収束する新しい不確実性ベルマン方程式(UBE)を提案する。
本稿では,リスク・サーキングとリスク・アバース・ポリシー最適化のいずれにも適用可能な汎用ポリシー最適化アルゴリズムQ-Uncertainty Soft Actor-Critic (QU-SAC)を導入する。
論文 参考訳(メタデータ) (2023-12-07T15:55:58Z) - Doubly Robust Distributionally Robust Off-Policy Evaluation and Learning [59.02006924867438]
オフ政治評価と学習(OPE/L)は、オフラインの観察データを使用してより良い意思決定を行う。
近年の研究では、分散ロバストなOPE/L (DROPE/L) が提案されているが、この提案は逆正則重み付けに依存している。
KL分散不確実性集合を用いたDROPE/Lの最初のDRアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-19T20:00:44Z) - Cram\'er-Rao bound-informed training of neural networks for quantitative
MRI [11.964144201247198]
ニューラルネットワークは、定量的MRI、特に磁気共鳴フィンガープリントでパラメーターを推定するためにますます使われている。
それらの利点は、より優れた速度と非効率な非バイアス推定器の優位性である。
しかし、不均一なパラメータを推定することは困難である。
CRBを用いて二乗誤差を正規化するClam'erRao損失関数を提案する。
論文 参考訳(メタデータ) (2021-09-22T06:38:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。