論文の概要: Toward Architecture-Agnostic Local Control of Posterior Collapse in VAEs
- arxiv url: http://arxiv.org/abs/2508.12530v1
- Date: Sun, 17 Aug 2025 23:45:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.842496
- Title: Toward Architecture-Agnostic Local Control of Posterior Collapse in VAEs
- Title(参考訳): VAEにおける後部崩壊のアーキテクチャ非依存的局所制御に向けて
- Authors: Hyunsoo Song, Seungwhan Kim, Seungkyu Lee,
- Abstract要約: 変分オートエンコーダ(VAE)は、生成されたサンプルの多様性を低下させる現象である後部崩壊に苦しむことが知られている。
本稿では,特定の構造に制約を加えることなく後部崩壊を制御するために,射影関数と合成関数の数学的性質に着想を得た遅延再構成(LR)損失を提案する。
MNIST, fashionMNIST, Omniglot, CelebA, FFHQなどの各種データセットの後方崩壊を制御する手法を実験的に評価した。
- 参考スコア(独自算出の注目度): 0.6144680854063939
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variational autoencoders (VAEs), one of the most widely used generative models, are known to suffer from posterior collapse, a phenomenon that reduces the diversity of generated samples. To avoid posterior collapse, many prior works have tried to control the influence of regularization loss. However, the trade-off between reconstruction and regularization is not satisfactory. For this reason, several methods have been proposed to guarantee latent identifiability, which is the key to avoiding posterior collapse. However, they require structural constraints on the network architecture. For further clarification, we define local posterior collapse to reflect the importance of individual sample points in the data space and to relax the network constraint. Then, we propose Latent Reconstruction(LR) loss, which is inspired by mathematical properties of injective and composite functions, to control posterior collapse without restriction to a specific architecture. We experimentally evaluate our approach, which controls posterior collapse on varied datasets such as MNIST, fashionMNIST, Omniglot, CelebA, and FFHQ.
- Abstract(参考訳): 変分自己エンコーダ(VAEs)は、最も広く使われている生成モデルの一つで、生成されたサンプルの多様性を低下させる現象である後部崩壊に悩まされていることが知られている。
後部崩壊を避けるため、多くの先行研究が正規化損失の影響を抑えようと試みてきた。
しかし、再建と正規化のトレードオフは不十分である。
このため, 後方崩壊防止の鍵となる潜伏識別性を保証するためにいくつかの手法が提案されている。
しかし、それらはネットワークアーキテクチャに構造的な制約を必要とする。
さらに,データ空間における個々のサンプル点の重要性を反映し,ネットワークの制約を緩和するため,局所的な後方崩壊を定義する。
そこで本研究では,射影関数と合成関数の数学的性質にインスパイアされた遅延再構成(LR)ロスを提案し,特定のアーキテクチャに制約を加えることなく後部崩壊を制御する。
MNIST, fashionMNIST, Omniglot, CelebA, FFHQなどの各種データセットの後方崩壊を制御する手法を実験的に評価した。
関連論文リスト
- DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Subspace-Guided Feature Reconstruction for Unsupervised Anomaly
Localization [5.085309164633571]
監督されていない異常なローカライゼーションは工業生産において重要な役割を担っている。
最近の手法では、事前訓練されたディープニューラルネットワークを用いて、ターゲットサンプルの特徴マッチングや再構成を行う。
本稿では,アノマライゼーションのための適応的特徴近似を追求する,新しいサブスペース誘導型特徴再構成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-25T06:58:57Z) - Controlling Posterior Collapse by an Inverse Lipschitz Constraint on the
Decoder Network [37.43129242269175]
変分オートエンコーダ(VAE)は、過去数十年にわたって大きな成功を収めてきた深層生成モデルの1つである。
VAEは後部崩壊と呼ばれる問題に悩まされ、エンコーダが故障した時に発生する。
逆リプシッツニューラルネットワークをデコーダに導入し、このアーキテクチャに基づいて、後方崩壊の度合いをシンプルで明確な方法で制御できる新しい方法を提案する。
論文 参考訳(メタデータ) (2023-04-25T12:45:06Z) - Mind the Backbone: Minimizing Backbone Distortion for Robust Object
Detection [52.355018626115346]
ドメインシフトに対して堅牢なオブジェクト検出器を構築することは、現実世界のアプリケーションにとって重要なことです。
我々は,ゆがみを特徴付けるバックボーンの脆弱性を測定する手段として,相対勾配ノルム(Relative Gradient Norm)を提案する。
両バックボーンのOOD堅牢性を高めるためのレシピを提案する。
論文 参考訳(メタデータ) (2023-03-26T14:50:43Z) - Discouraging posterior collapse in hierarchical Variational Autoencoders
using context [19.47169312443202]
トップダウン階層のVAEは、深い潜伏構造を効果的に学習し、後部崩壊のような問題を回避できるという意見が一致している。
ここでは,必ずしもそうではないことを示すとともに,後方崩壊の問題も残る。
具体的には、離散コサイン変換を用いて最後の潜伏変数を得る。
論文 参考訳(メタデータ) (2023-02-20T13:44:47Z) - Making Reconstruction-based Method Great Again for Video Anomaly
Detection [64.19326819088563]
ビデオの異常検出は重要な問題だが、難しい問題だ。
既存の再構成に基づく手法は、昔ながらの畳み込みオートエンコーダに依存している。
連続フレーム再構築のための新しいオートエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2023-01-28T01:57:57Z) - Posterior Collapse and Latent Variable Non-identifiability [54.842098835445]
柔軟性を犠牲にすることなく識別性を強制する深層生成モデルである,潜時同定可能な変分オートエンコーダのクラスを提案する。
合成および実データ全体にわたって、潜在識別可能な変分オートエンコーダは、後方崩壊を緩和し、データの有意義な表現を提供する既存の方法より優れている。
論文 参考訳(メタデータ) (2023-01-02T06:16:56Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。