Fugu-MT 論文翻訳(概要): Sequential Monte Carlo for Inclusive KL Minimization in Amortized Variational Inference

論文の概要: Sequential Monte Carlo for Inclusive KL Minimization in Amortized Variational Inference

arxiv url: http://arxiv.org/abs/2403.10610v1
Date: Fri, 15 Mar 2024 18:13:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-19 22:44:00.350586
Title: Sequential Monte Carlo for Inclusive KL Minimization in Amortized Variational Inference
Title（参考訳）: 変分推論における包括的KL最小化のための連続モンテカルロ
Authors: Declan McNamara, Jackson Loper, Jeffrey Regier,
Abstract要約: SMC-Wakeは,モンテカルロの連続検層を用いて包摂的KL偏差の勾配を推定する補正式である。シミュレーションと実データの両方を用いた実験では、SMC-Wakeは既存の手法よりも後方を正確に近似する変動分布に適合する。
参考スコア（独自算出の注目度）: 3.126959812401426
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: For training an encoder network to perform amortized variational inference, the Kullback-Leibler (KL) divergence from the exact posterior to its approximation, known as the inclusive or forward KL, is an increasingly popular choice of variational objective due to the mass-covering property of its minimizer. However, minimizing this objective is challenging. A popular existing approach, Reweighted Wake-Sleep (RWS), suffers from heavily biased gradients and a circular pathology that results in highly concentrated variational distributions. As an alternative, we propose SMC-Wake, a procedure for fitting an amortized variational approximation that uses likelihood-tempered sequential Monte Carlo samplers to estimate the gradient of the inclusive KL divergence. We propose three gradient estimators, all of which are asymptotically unbiased in the number of iterations and two of which are strongly consistent. Our method interleaves stochastic gradient updates, SMC samplers, and iterative improvement to an estimate of the normalizing constant to reduce bias from self-normalization. In experiments with both simulated and real datasets, SMC-Wake fits variational distributions that approximate the posterior more accurately than existing methods.
Abstract（参考訳）: エンコーダネットワークをトレーニングしてアモータライズされた変分推論を行う場合、KL(Kulback-Leibler)は、その最小値の質量被覆特性により、その近似から包含的あるいは前方的KLと呼ばれる近似への分岐がますます一般的になっている。しかし、この目的を最小化するのは難しい。既存の一般的なアプローチであるReweighted Wake-Sleep (RWS)は、偏りの強い勾配と、高度に集中した変動分布をもたらす円形の病理に悩まされている。 SMC-Wake(SMC-Wake)は,モンテカルロ検層を用いて包摂的KL偏差の勾配を推定する近似法である。 3つの勾配推定器を提案し、これらは全て漸近的に反復数に偏りがなく、2つは強く一貫したものである。提案手法は, 確率勾配更新, SMC サンプリング器, 反復的な改良を行い, 正規化定数の推定を行い, 自己正規化からのバイアスを低減する。シミュレーションと実データの両方を用いた実験では、SMC-Wakeは既存の手法よりも後方を正確に近似する変動分布に適合する。

関連論文リスト

Diffusion Alignment Beyond KL: Variance Minimisation as Effective Policy Optimiser [35.260598916253635]
可変最小化政策最適化(VMPO)について紹介する。 VMPOは、ログの重みの分散を最小限に抑えるために拡散アライメントを定式化する。ポテンシャル関数と分散最小化戦略の異なる選択の下で、VMPOは様々な既存メソッドを復元する。
論文参考訳（メタデータ） (2026-02-12T18:06:03Z)
The Implicit Bias of Steepest Descent with Mini-batch Stochastic Gradient [32.97211471008323]
本研究では, バッチサイズ, 運動量, 分散の低減が, 最大張力挙動と収束率の制限をいかに形成するかを検討した。運動量なしでは、収束は大きなバッチでのみ発生し、バッチ依存のマージンギャップを生じるが、フルバッチ収束速度は得られないことを示す。
論文参考訳（メタデータ） (2026-02-12T04:25:38Z)
An Elementary Approach to Scheduling in Generative Diffusion Models [55.171367482496755]
生成拡散モデルにおけるノイズスケジューリングと時間離散化の影響を特徴付けるための基礎的手法を開発した。異なるデータセットと事前訓練されたモデルにわたる実験により、我々のアプローチによって選択された時間離散化戦略が、ベースラインとサーチベースの戦略を一貫して上回ることを示した。
論文参考訳（メタデータ） (2026-01-20T05:06:26Z)
Semi-Implicit Variational Inference via Kernelized Path Gradient Descent [12.300415631357406]
Kullback-Leibler分散を用いたトレーニングは、高次元設定における高分散とバイアスのために難しい場合がある。非パラメトリックな平滑化によるトレーニングを安定化するカーネル化されたKL分散推定器を提案する。関数空間における我々の手法のバイアスは良性であり、より安定で効率的な最適化をもたらす。
論文参考訳（メタデータ） (2025-06-05T14:34:37Z)
Model-Based Reparameterization Policy Gradient Methods: Theory and Practical Algorithms [88.74308282658133]
Reization (RP) Policy Gradient Methods (PGM) は、ロボット工学やコンピュータグラフィックスにおける連続的な制御タスクに広く採用されている。近年の研究では、長期強化学習問題に適用した場合、モデルベースRP PGMはカオス的かつ非滑らかな最適化環境を経験する可能性があることが示されている。本稿では,長期モデルアンロールによる爆発的分散問題を緩和するスペクトル正規化法を提案する。
論文参考訳（メタデータ） (2023-10-30T18:43:21Z)
Robust scalable initialization for Bayesian variational inference with multi-modal Laplace approximations [0.0]
フル共分散構造を持つ変分混合は、パラメータ数による変動パラメータによる二次的な成長に苦しむ。本稿では,変分推論のウォームスタートに使用できる初期ガウスモデル近似を構築する方法を提案する。
論文参考訳（メタデータ） (2023-07-12T19:30:04Z)
Adaptive Annealed Importance Sampling with Constant Rate Progress [68.8204255655161]
Annealed Importance Smpling (AIS)は、抽出可能な分布から重み付けされたサンプルを合成する。本稿では,alpha$-divergencesに対する定数レートAISアルゴリズムとその効率的な実装を提案する。
論文参考訳（メタデータ） (2023-06-27T08:15:28Z)
Bayesian Pseudo-Coresets via Contrastive Divergence [5.479797073162603]
対照的な発散を利用して擬似コアセットを構築するための新しい手法を提案する。これは擬似コアセット構築プロセスにおける近似の必要性を排除する。複数のデータセットに対して広範な実験を行い、既存のBPC技術よりも優れていることを示す。
論文参考訳（メタデータ） (2023-03-20T17:13:50Z)
Differentiable Annealed Importance Sampling and the Perils of Gradient Noise [68.44523807580438]
Annealed importance sample (AIS) と関連するアルゴリズムは、限界推定のための非常に効果的なツールである。差別性は、目的として限界確率を最適化する可能性を認めるため、望ましい性質である。我々はメトロポリス・ハスティングスのステップを放棄して微分可能アルゴリズムを提案し、ミニバッチ計算をさらに解き放つ。
論文参考訳（メタデータ） (2021-07-21T17:10:14Z)
Variational Refinement for Importance Sampling Using the Forward Kullback-Leibler Divergence [77.06203118175335]
変分推論(VI)はベイズ推論における正確なサンプリングの代替として人気がある。重要度サンプリング(IS)は、ベイズ近似推論手順の推定を微調整し、偏りを逸脱するためにしばしば用いられる。近似ベイズ推論のための最適化手法とサンプリング手法の新たな組み合わせを提案する。
論文参考訳（メタデータ） (2021-06-30T11:00:24Z)
An adaptive Hessian approximated stochastic gradient MCMC method [12.93317525451798]
後方からのサンプリング中に局所的幾何情報を組み込む適応型ヘッセン近似勾配MCMC法を提案する。我々は,ネットワークの空間性を高めるために,等級に基づく重み付け法を採用する。
論文参考訳（メタデータ） (2020-10-03T16:22:15Z)
A Study of Gradient Variance in Deep Learning [56.437755740715396]
階層化サンプリングによる平均ミニバッチ勾配のばらつきを最小化する手法であるグラディエントクラスタリングを導入する。我々は、一般的なディープラーニングベンチマークの勾配分散を測定し、一般的な仮定に反して、トレーニング中に勾配分散が増加することを観察する。
論文参考訳（メタデータ） (2020-07-09T03:23:10Z)
Path Sample-Analytic Gradient Estimators for Stochastic Binary Networks [78.76880041670904]
二進的アクティベーションや二進的重みを持つニューラルネットワークでは、勾配降下によるトレーニングは複雑である。そこで本研究では,サンプリングと解析近似を併用した新しい推定法を提案する。勾配推定において高い精度を示し、深部畳み込みモデルにおいてより安定かつ優れた訓練を行うことを示す。
論文参考訳（メタデータ） (2020-06-04T21:51:21Z)
Amortized variance reduction for doubly stochastic objectives [17.064916635597417]
複素確率モデルにおける近似推論は二重目的関数の最適化を必要とする。現在のアプローチでは、ミニバッチがサンプリング性にどのように影響するかを考慮せず、結果として準最適分散が減少する。本稿では,認識ネットワークを用いて各ミニバッチに対して最適な制御変数を安価に近似する手法を提案する。
論文参考訳（メタデータ） (2020-03-09T13:23:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。