論文の概要: PeLAP-A: Adaptive Latent Pruning for Lightweight Latent Diffusion Models
- arxiv url: http://arxiv.org/abs/2606.23086v1
- Date: Mon, 22 Jun 2026 09:33:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 00:18:04.511266
- Title: PeLAP-A: Adaptive Latent Pruning for Lightweight Latent Diffusion Models
- Title(参考訳): PeLAP-A:軽量潜伏拡散モデルのための適応潜伏プルーニング
- Authors: Kissa Zahra, Zaib Un Nisa,
- Abstract要約: PeLAP-A(Adaptive Latent Pruning for Diffusion)は、標準的な潜伏拡散パイプラインを学習可能なチャネルワイドな予測器で拡張する軽量フレームワークである。
アグレッシブなスパシティ規則化の下では、重要予測器は全ての潜伏チャネルをほぼゼロに駆動するが、デノナイズされたUNetは拡散損失を低くする。
これらの知見は、潜伏拡散訓練におけるスパーシティダイナミクスの探索的研究であり、潜伏流路抑制に対してかなり頑健であることを示すものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Latent diffusion models achieve strong generative performance by operating in a compressed latent space produced by a variational autoencoder (VAE). However, it remains unclear whether all latent channels contribute equally to the diffusion process, or whether significant redundancy exists. We introduce PeLAP-A (Adaptive Latent Pruning for Diffusion), a lightweight framework that augments a standard latent diffusion pipeline with a learnable channel-wise importance predictor. A two-layer MLP operating on globally pooled latent features produces a soft mask that suppresses unimportant latent channels before they enter the denoising UNet. The entire system is trained jointly on CIFAR-10 under a combined diffusion, reconstruction, and sparsity loss. Experiments reveal a striking result: under aggressive sparsity regularization (lambda = 0.01), the importance predictor drives all latent channels to near-zero yet the denoising UNet achieves lower diffusion loss (0.0236 vs. 0.0240) and lower VAE reconstruction MSE (22.59 vs. 24.67) compared to the unpruned baseline. We term this the sparsity collapse phenomenon and provide an analysis of why it occurs and what it reveals about the information requirements of latent diffusion models. These findings constitute an exploratory study of sparsity dynamics in latent diffusion training, and demonstrate that denoising UNets can remain remarkably robust to latent channel suppression even under aggressive regularization. Code is available at: https://github.com/kissasium/PeLAP-A.git.
- Abstract(参考訳): 変分オートエンコーダ(VAE)によって生成された圧縮潜時空間で演算することで、潜時拡散モデルによる強い生成性能を実現する。
しかしながら、全ての潜伏チャネルが拡散過程に等しく寄与するか、あるいは大きな冗長性が存在するかは、まだ不明である。
PeLAP-A(Adaptive Latent Pruning for Diffusion)は、標準的な潜伏拡散パイプラインを学習可能なチャネルワイドな予測器で拡張する軽量フレームワークである。
グローバルプールされた潜在機能で動作する2層MLPは、デノイングUNetに入る前に重要でない潜在チャネルを抑えるソフトマスクを生成する。
システム全体はCIFAR-10で共同で、拡散、再構築、空間的損失の複合で訓練される。
攻撃的なスパーシリティ正規化(lambda = 0.01)の下では、重要予測器は全ての潜伏チャネルをほぼゼロに駆動するが、デノナイズされたUNetは拡散損失(0.0236 vs. 0.0240)を低くし、VAE再構成MSE(22.59 vs. 24.67)を未実行ベースラインと比較する。
これを空間崩壊現象と呼び、なぜそれが起こるのか、また潜伏拡散モデルの情報要求について何を明らかにするのかを解析する。
これらの知見は潜伏拡散訓練におけるスパーシティダイナミクスの探索的研究であり、アグレッシブ・レギュレーションの下でも潜伏チャネルの抑制に対してかなり頑健であることを示す。
コードは、https://github.com/kissasium/PeLAP-A.git.comで入手できる。
関連論文リスト
- Decoupled Residual Denoising Diffusion Models for Unified and Data Efficient Image-to-Image Translation [29.96691004865241]
本稿では,統合的かつデータ効率のよいイメージ・ツー・イメージ(I2I)翻訳のためのDDD(Decoupled Residual Denoising Diffusion Model)を提案する。
論文 参考訳(メタデータ) (2026-05-31T06:38:18Z) - Latent Diffusion for Missing Data [6.869298033298736]
本研究は,MCARの崩壊下で,学習した潜在表現への拡散のシフトが頑健性を向上させるか否かを考察する。
下流の計算では、潜伏拡散はピクセル空間の拡散よりも一貫して優れた性能を達成する。
論文 参考訳(メタデータ) (2026-05-27T12:57:09Z) - Boosting Fidelity for Pre-Trained-Diffusion-Based Low-Light Image Enhancement via Condition Refinement [63.54516423266521]
事前学習拡散ベース(PTDB)法は、しばしばコンテンツ忠実さを犠牲にして知覚的リアリズムを高める。
本稿では,事前学習した拡散モデルにおける条件付けのための新しい最適化手法を提案する。
我々のアプローチはプラグアンドプレイであり、より効率的な制御を提供するために既存の拡散ネットワークにシームレスに統合される。
論文 参考訳(メタデータ) (2025-10-20T02:40:06Z) - DiffusionNFT: Online Diffusion Reinforcement with Forward Process [99.94852379720153]
Diffusion Negative-aware FineTuning (DiffusionNFT) は、フローマッチングを通じて前方プロセス上で直接拡散モデルを最適化する新しいオンラインRLパラダイムである。
DiffusionNFTは、CFGフリーのFlowGRPOよりも25倍効率が高い。
論文 参考訳(メタデータ) (2025-09-19T16:09:33Z) - Improved Immiscible Diffusion: Accelerate Diffusion Training by Reducing Its Miscibility [62.272571285823595]
不和がいかに軽視し、効率を向上するかを示す。
そこで本稿では,K-nearest neighbor (KNN) ノイズ選択や画像スケーリングなどの実装のファミリを提案する。
この研究は、今後の高効率拡散訓練研究の新たな方向性を確立する。
論文 参考訳(メタデータ) (2025-05-24T05:38:35Z) - Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models [82.8261101680427]
滑らかな潜伏空間は、入力潜伏空間上の摂動が出力画像の定常的な変化に対応することを保証している。
この特性は、画像の反転、反転、編集を含む下流タスクにおいて有益である。
スムース拡散(Smooth Diffusion, Smooth Diffusion)は, 高速かつスムーズな拡散モデルである。
論文 参考訳(メタデータ) (2023-12-07T16:26:23Z) - Diffusion-GAN: Training GANs with Diffusion [135.24433011977874]
GAN(Generative Adversarial Network)は、安定してトレーニングすることが難しい。
フォワード拡散チェーンを利用してインスタンスノイズを生成する新しいGANフレームワークであるDiffusion-GANを提案する。
我々は,Diffusion-GANにより,最先端のGANよりも高い安定性とデータ効率で,よりリアルな画像を生成することができることを示す。
論文 参考訳(メタデータ) (2022-06-05T20:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。