Fugu-MT 論文翻訳(概要): Deep unfolding of MCMC kernels: scalable, modular & explainable GANs for high-dimensional posterior sampling

論文の概要: Deep unfolding of MCMC kernels: scalable, modular & explainable GANs for high-dimensional posterior sampling

arxiv url: http://arxiv.org/abs/2602.20758v1
Date: Tue, 24 Feb 2026 10:37:10 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.714804
Title: Deep unfolding of MCMC kernels: scalable, modular & explainable GANs for high-dimensional posterior sampling
Title（参考訳）: MCMCカーネルの深部展開:高次元後方サンプリングのための拡張性,モジュール性,説明可能なGAN
Authors: Jonathan Spence, Tobías I. Liaudat, Konstantinos Zygalakis, Marcelo Pereyra,
Abstract要約: 本稿では,Langevin MCMCアルゴリズムにディープ・アンフォールディングを適用することで,GANアーキテクチャ設計の新しいアプローチを提案する。このパラダイムは固定ステップ反復アルゴリズムをモジュラーニューラルネットワークにマッピングし、柔軟で解釈に適したアーキテクチャを生み出す。後方サンプリングのための教師付き正規化Wasserstein GANフレームワークを用いて、これらの展開されたサンプルをエンドツーエンドにトレーニングする。
参考スコア（独自算出の注目度）: 1.930761833716203
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Markov chain Monte Carlo (MCMC) methods are fundamental to Bayesian computation, but can be computationally intensive, especially in high-dimensional settings. Push-forward generative models, such as generative adversarial networks (GANs), variational auto-encoders and normalising flows offer a computationally efficient alternative for posterior sampling. However, push-forward models are opaque as they lack the modularity of Bayes Theorem, leading to poor generalisation with respect to changes in the likelihood function. In this work, we introduce a novel approach to GAN architecture design by applying deep unfolding to Langevin MCMC algorithms. This paradigm maps fixed-step iterative algorithms onto modular neural networks, yielding architectures that are both flexible and amenable to interpretation. Crucially, our design allows key model parameters to be specified at inference time, offering robustness to changes in the likelihood parameters. We train these unfolded samplers end-to-end using a supervised regularized Wasserstein GAN framework for posterior sampling. Through extensive Bayesian imaging experiments, we demonstrate that our proposed approach achieves high sampling accuracy and excellent computational efficiency, while retaining the physics consistency, adaptability and interpretability of classical MCMC strategies.
Abstract（参考訳）: マルコフ連鎖モンテカルロ法(MCMC)はベイズ計算の基本であるが、特に高次元の設定では計算集約的である。生成逆数ネットワーク(GAN)、変分自動エンコーダ、正規化フローなどのプッシュフォワード生成モデルは、後方サンプリングの計算効率の良い代替手段を提供する。しかし、プッシュフォワードモデルはベイズ・セオレムのモジュラリティが欠如しているため不透明であり、可能性関数の変化に関して一般化が不十分である。本稿では,Langevin MCMCアルゴリズムにディープ・アンフォールディングを適用することで,GANアーキテクチャ設計の新しいアプローチを提案する。このパラダイムは固定ステップ反復アルゴリズムをモジュラーニューラルネットワークにマッピングし、柔軟で解釈に適したアーキテクチャを生み出す。重要なことに、我々の設計では、主要なモデルパラメータを推論時に指定することができ、可能性パラメータの変化に対して堅牢性を提供します。後方サンプリングのための教師付き正規化Wasserstein GANフレームワークを用いて、これらの展開されたサンプルをエンドツーエンドにトレーニングする。ベイズ画像実験により,従来のMCMC戦略の物理的整合性,適応性,解釈性を維持しつつ,高いサンプリング精度と優れた計算効率が得られることを示した。

関連論文リスト

Belief Net: A Filter-Based Framework for Learning Hidden Markov Models from Observations [0.5161531917413708]
この研究は、勾配に基づく最適化を通じて隠れマルコフモデルを学ぶ新しいフレームワークであるBelief Netを紹介している。ブラックボックストランスフォーマーモデルとは異なり、Belief Netの学習可能なウェイトは、初期分布、遷移行列、放出行列のロジットである。合成HMMデータにおいて、Belief NetはBaum-Welchに比べて収束速度が優れ、不完全条件と過完全条件の両方でパラメータの回復に成功している。
論文参考訳（メタデータ） (2025-11-13T18:08:19Z)
Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文参考訳（メタデータ） (2025-09-03T18:05:02Z)
FBMS: An R Package for Flexible Bayesian Model Selection and Model Averaging [14.487258585834374]
FBMSパッケージは、効率的なMode Jumping Markov Chain Monte Carlo (MJMCMC)アルゴリズムを実装している。この枠組みの中で、アルゴリズムは変換された特徴の集団を維持・更新し、その後部確率を計算し、それらから構築されたモデルの後部確率を評価する。ガウス回帰における推論モデルと予測モデルの両方にFBMSを効果的に利用することを示し、BGNLMモデルの異なるインスタンスに着目した。
論文参考訳（メタデータ） (2025-08-31T09:04:01Z)
Latent Thought Models with Variational Bayes Inference-Time Computation [52.63299874322121]
ラテント思考モデル(LTM)は、ラテント空間における明示的な事前モデルに従う明示的なラテント思考ベクトルを包含する。 LTMは自己回帰モデルや離散拡散モデルよりも優れたサンプルおよびパラメータ効率を示す。
論文参考訳（メタデータ） (2025-02-03T17:50:34Z)
Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文参考訳（メタデータ） (2023-12-19T21:45:38Z)
Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。 EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文参考訳（メタデータ） (2023-12-10T15:22:30Z)
Scaling Pre-trained Language Models to Deeper via Parameter-efficient Architecture [68.13678918660872]
行列積演算子(MPO)に基づくより有能なパラメータ共有アーキテクチャを設計する。 MPO分解はパラメータ行列の情報を再編成し、2つの部分に分解することができる。私たちのアーキテクチャは、モデルのサイズを減らすために、すべてのレイヤで中央テンソルを共有しています。
論文参考訳（メタデータ） (2023-03-27T02:34:09Z)
A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。 DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文参考訳（メタデータ） (2022-03-21T14:53:57Z)
Bayesian Structure Learning with Generative Flow Networks [85.84396514570373]
ベイズ構造学習では、データから有向非巡回グラフ(DAG)上の分布を推定することに興味がある。近年,ジェネレーティブ・フロー・ネットワーク(GFlowNets)と呼ばれる確率モデルのクラスが,ジェネレーティブ・モデリングの一般的なフレームワークとして紹介されている。 DAG-GFlowNetと呼ばれる本手法は,DAGよりも後方の正確な近似を提供する。
論文参考訳（メタデータ） (2022-02-28T15:53:10Z)
Structured Stochastic Gradient MCMC [20.68905354115655]
近似した後方関数形式を仮定しない新しい非パラメトリック変分近似を提案する。完全なSGMCMCよりも優れた予測可能性と有効試料サイズが得られる。
論文参考訳（メタデータ） (2021-07-19T17:18:10Z)
An adaptive Hessian approximated stochastic gradient MCMC method [12.93317525451798]
後方からのサンプリング中に局所的幾何情報を組み込む適応型ヘッセン近似勾配MCMC法を提案する。我々は,ネットワークの空間性を高めるために,等級に基づく重み付け法を採用する。
論文参考訳（メタデータ） (2020-10-03T16:22:15Z)
Deep Involutive Generative Models for Neural MCMC [3.6739949215165164]
Involutive Neural MCMCを定義するために,Deep Involutive Generative ModelとDeep Generative Modelingの新しいアーキテクチャを導入する。本稿では、これらのモデルによるボリューム保存の方法と、深部保存型インボリューティブな生成モデルを用いてMetropolis-Hastingsを効果的に更新する方法を示す。
論文参考訳（メタデータ） (2020-06-26T18:45:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。