論文の概要: Iterative Amortized Hierarchical VAE
- arxiv url: http://arxiv.org/abs/2601.15894v1
- Date: Thu, 22 Jan 2026 12:18:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.59488
- Title: Iterative Amortized Hierarchical VAE
- Title(参考訳): 反復再生階層型VAE
- Authors: Simon W. Penninga, Ruud J. G. van Sloun,
- Abstract要約: 我々はIA-HVAE(Iterative Amortized Hierarchical Variational Autoencoder)を提案する。
これは、初期償却推定とデコーダ勾配による反復精製を含むハイブリッドスキームにより、償却推論を拡大する。
我々のハイブリッドアプローチは, それぞれ精度と速度において, 完全償却と完全反復等価性に優れることを示す。
- 参考スコア(独自算出の注目度): 21.235933524239773
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we propose the Iterative Amortized Hierarchical Variational Autoencoder (IA-HVAE), which expands on amortized inference with a hybrid scheme containing an initial amortized guess and iterative refinement with decoder gradients. We achieve this by creating a linearly separable decoder in a transform domain (e.g. Fourier space), enabling real-time applications with very high model depths. The architectural change leads to a 35x speed-up for iterative inference with respect to the traditional HVAE. We show that our hybrid approach outperforms fully amortized and fully iterative equivalents in accuracy and speed respectively. Moreover, the IAHVAE shows improved reconstruction quality over a vanilla HVAE in inverse problems such as deblurring and denoising.
- Abstract(参考訳): 本稿では,初期償却推定とデコーダ勾配による反復改良を含むハイブリッドスキームを用いて,償却推論を拡大する反復償却階層型変分オートエンコーダ(IA-HVAE)を提案する。
変換領域(例えばフーリエ空間)内で線形分離可能なデコーダを作成し、非常に高いモデル深度を持つリアルタイムアプリケーションを実現する。
アーキテクチャの変更は、従来のHVAEに対する反復推論の35倍のスピードアップにつながる。
我々のハイブリッドアプローチは, それぞれ精度と速度において, 完全償却と完全反復等価性に優れることを示す。
さらに、IAHVAEは、デブロアリングやデノーミングなどの逆問題において、バニラHVAEの再構築品質を改善した。
関連論文リスト
- Advancing accelerator virtual beam diagnostics through latent evolution modeling: an integrated solution to forward, inverse, tuning, and UQ problems [46.568487965999225]
我々は,高次元位相空間を低次元表現に投影するオートエンコーダと,潜時空間における時間ダイナミクスを学習するための変換器を備えたハイブリッド機械学習フレームワークであるLatent Evolution Model (LEM)を提案する。
テキストフォワードモデリングでは、CVAEは6次元位相空間の15のユニークな射影を潜在表現に符号化し、トランスフォーマーは上流からの入力から下流の潜在状態を予測する。
テキスト逆問題では、(a)下流観測から上流位相空間を予測すること、(b)潜時空間からRF設定を推定することの2つの異なる課題に対処する。
論文 参考訳(メタデータ) (2026-02-26T04:46:26Z) - Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。
本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文 参考訳(メタデータ) (2025-12-28T05:48:55Z) - Denoising Vision Transformer Autoencoder with Spectral Self-Regularization [21.85836384863372]
本研究では,高次元潜在空間における冗長な高周波成分が拡散モデルの訓練収束を妨げていることを示す。
本稿では, スペクトル自己正則化手法を提案し, 冗長な高周波ノイズを抑制すると同時に, 復元品質を同時に維持する。
その結果、ViTベースのオートエンコーダであるDenoising-VAEは、よりクリーンで低ノイズの潜伏剤を生成し、生成品質の向上と最適化の高速化につながる。
論文 参考訳(メタデータ) (2025-11-16T15:00:32Z) - Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement [89.99237142387655]
LH-VAEを導入し、視覚的意味的制約や進行的劣化による意味的堅牢性を高める。
Latent Harmonyは、UHD修復のためのVAEを再定義する2段階のフレームワークである。
実験により、Latent HarmonyはUHDおよび標準解像度タスクにまたがって最先端のパフォーマンスを実現し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
論文 参考訳(メタデータ) (2025-10-09T08:54:26Z) - Flow-Matching Guided Deep Unfolding for Hyperspectral Image Reconstruction [53.26903617819014]
Flow-Matching-Guided Unfolding Network (FMU)は、最初にフローマッチングをHSI再構成に統合する。
学習力学をさらに強化するために,平均速度損失を導入する。
シミュレーションと実データの両方の実験により、FMUは復元品質において既存のアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-10-02T11:32:00Z) - Progressive Flow-inspired Unfolding for Spectral Compressive Imaging [11.638690628451647]
符号化開口スナップショット分光画像(CASSI)は、単一の2次元圧縮計測から3次元ハイパースペクトル画像(HSI)を取得する。
近年の深層展開ネットワーク (DUN) はCASSI再建の最先端を達成している。
拡散軌跡と流れの整合性に着想を得て,新しい軌道制御可能な展開フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-15T16:10:50Z) - Zero-Variance Gradients for Variational Autoencoders [32.818968022327866]
変分オートエンコーダ(VAE)のような深層生成モデルの訓練は、潜伏変数のサンプリングを通じて勾配をバックプロパゲートする必要性によって、しばしば妨げられる。
本稿では,この問題をサイドステップとして,Silent Gradientsと呼ぶ新しい視点を提案する。
推定器を改良する代わりに、特定のデコーダアーキテクチャを解析的に利用して予測されるELBOを計算する。
論文 参考訳(メタデータ) (2025-08-05T15:54:21Z) - RestoreVAR: Visual Autoregressive Generation for All-in-One Image Restoration [51.77917733024544]
潜時拡散モデル(LDM)はオールインワン画像復元法(AiOR)の知覚的品質を改善した。
LDMは反復的なデノゲーションプロセスによって推論が遅くなり、時間に敏感なアプリケーションでは実用的でない。
VAR(Visual Autoregressive Modeling)は、スケールスペースの自己回帰を行い、最先端の拡散変換器に匹敵する性能を実現する。
論文 参考訳(メタデータ) (2025-05-23T15:52:26Z) - Epsilon-VAE: Denoising as Visual Decoding [61.29255979767292]
復号化は1段階の再構成から反復的改良へと移行する。
具体的には、デコーダを拡散処理に置き換え、ノイズを反復的に改善して元の画像を復元する。
拡散による反復的再構成により, 自己エンコーダであるEpsilon-VAEは高い再構成品質を実現する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。