Fugu-MT 論文翻訳(概要): Enhancing Diffusion Models Efficiency by Disentangling Total-Variance and Signal-to-Noise Ratio

論文の概要: Enhancing Diffusion Models Efficiency by Disentangling Total-Variance and Signal-to-Noise Ratio

arxiv url: http://arxiv.org/abs/2502.08598v1
Date: Wed, 12 Feb 2025 17:35:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-13 18:10:01.097599
Title: Enhancing Diffusion Models Efficiency by Disentangling Total-Variance and Signal-to-Noise Ratio
Title（参考訳）: 全変量比と信号対雑音比を両立させることによる拡散モデルの効率向上
Authors: Khaled Kahouli, Winfried Ripken, Stefan Gugler, Oliver T. Unke, Klaus-Robert Müller, Shinichi Nakajima,
Abstract要約: 本稿では,TV と SNR を独立に制御できる,TV/SNR フレームワークを提案する。最適輸送流マッチングのSNRスケジュールの一般化は、分子構造生成の性能を著しく向上させる。画像生成において同様の傾向が見られ、均一な拡散時間格子を用いたアプローチは、高度に調整されたEDMサンプリング器と同等に機能する。
参考スコア（独自算出の注目度）: 16.25297742874181
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The long sampling time of diffusion models remains a significant bottleneck, which can be mitigated by reducing the number of diffusion time steps. However, the quality of samples with fewer steps is highly dependent on the noise schedule, i.e., the specific manner in which noise is introduced and the signal is reduced at each step. Although prior work has improved upon the original variance-preserving and variance-exploding schedules, these approaches $\textit{passively}$ adjust the total variance, without direct control over it. In this work, we propose a novel total-variance/signal-to-noise-ratio disentangled (TV/SNR) framework, where TV and SNR can be controlled independently. Our approach reveals that different existing schedules, where the TV explodes exponentially, can be $\textit{improved}$ by setting a constant TV schedule while preserving the same SNR schedule. Furthermore, generalizing the SNR schedule of the optimal transport flow matching significantly improves the performance in molecular structure generation, achieving few step generation of stable molecules. A similar tendency is observed in image generation, where our approach with a uniform diffusion time grid performs comparably to the highly tailored EDM sampler.
Abstract（参考訳）: 拡散モデルの長いサンプリング時間は重要なボトルネックであり、拡散時間ステップの数を減らすことで緩和することができる。しかし、少ないステップのサンプルの品質はノイズスケジュールに大きく依存しており、すなわち、ノイズが導入され、各ステップで信号が減少する特定の方法である。従来の作業は、分散保存と分散公開のスケジュールを改善するが、これらのアプローチは、直接制御することなく、全分散を調整する。そこで本研究では,TVとSNRを独立に制御できる,新しいTV/SNRフレームワークを提案する。提案手法では,SNRのスケジュールを保ちながらテレビのスケジュールを一定に設定することで,テレビが指数的に爆発的に爆発する既存のスケジュールを$\textit{improved}$にすることができる。さらに, 最適輸送流マッチングのSNRスケジュールの一般化により, 分子構造生成の性能が著しく向上し, 安定な分子の段階生成がほとんど得られない。画像生成において同様の傾向が見られ、均一な拡散時間格子を用いたアプローチは、高度に調整されたEDMサンプリング器と同等に機能する。

関連論文リスト

Diffusion Models for Solving Inverse Problems via Posterior Sampling with Piecewise Guidance [52.705112811734566]
断片的なガイダンススキームを用いて,逆問題を解決するための新しい拡散型フレームワークが導入された。提案手法は問題に依存しず,様々な逆問題に容易に適応できる。このフレームワークは, (4時間), (8時間) の超分解能タスクに対して, (23%), (24%) および (24%) の無作為マスクを塗布する場合の (25%) の推論時間を短縮する。
論文参考訳（メタデータ） (2025-07-22T19:35:14Z)
Optimizing Noise Schedules of Generative Models in High Dimensionss [18.19470017419402]
分散(VP)と分散爆発(VE)の保存に特有なノイズスケジュールは,高次特徴と低次特徴の両方の回復を可能にすることを示す。また、これらのスケジュールは、確率フローODEを識別可能なGMとCurie-Weiss(CW)モデルの生成モデルが得られることを示す。
論文参考訳（メタデータ） (2025-01-02T00:39:00Z)
Constant Rate Schedule: Constant-Rate Distributional Change for Efficient Training and Sampling in Diffusion Models [16.863038973001483]
ノイズスケジュールは、拡散したデータの確率分布の変化率を一定に保証する。ノイズスケジュールは自動的に決定され、各データセットと種類の拡散モデルに合わせて調整される。
論文参考訳（メタデータ） (2024-11-19T03:02:39Z)
Conditional GAN for Enhancing Diffusion Models in Efficient and Authentic Global Gesture Generation from Audios [10.57695963534794]
VAEに基づく手法には、局所的なジッタとグローバルな不安定性の問題が伴う。本稿では,音声制御信号を捕捉し,拡散段差と発声段差の多モーダル denoising 分布を暗黙的に一致させる条件付き GAN を提案する。
論文参考訳（メタデータ） (2024-10-27T07:25:11Z)
Zero-Shot Adaptation for Approximate Posterior Sampling of Diffusion Models in Inverse Problems [2.8237889121096034]
画像の逆問題に対するゼロショット近似後方サンプリング(ZAPS)を提案する。 ZAPSはサンプリングステップの数を修正し、物理学誘導損失関数によるゼロショットトレーニングを使用して、不規則な時間ステップ毎にログライクな重みを学習する。以上の結果から,ZAPSは推定時間を短縮し,不規則な騒音スケジュールに頑健性を提供し,再現性の向上を図っている。
論文参考訳（メタデータ） (2024-07-16T00:09:37Z)
Improved Noise Schedule for Diffusion Training [51.849746576387375]
本稿では,拡散モデルのトレーニングを強化するため,ノイズスケジュールを設計するための新しい手法を提案する。我々は,標準のコサインスケジュールよりもノイズスケジュールの方が優れていることを実証的に示す。
論文参考訳（メタデータ） (2024-07-03T17:34:55Z)
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.43824674873508]
拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文参考訳（メタデータ） (2024-03-26T16:57:55Z)
Diffusion-TS: Interpretable Diffusion for General Time Series Generation [6.639630994040322]
Diffusion-TSは、高品質な時系列サンプルを生成する新しい拡散ベースのフレームワークである。各拡散ステップのノイズの代わりにサンプルを直接再構成するようにモデルを訓練し、フーリエに基づく損失項を組み合わせた。その結果,Diffusion-TSは時系列の様々な現実的解析において最先端の結果が得られることがわかった。
論文参考訳（メタデータ） (2024-03-04T05:39:23Z)
One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion Schedule Flaws and Enhancing Low-Frequency Controls [77.42510898755037]
One More Step (OMS) は、推論中に単純だが効果的なステップを付加したコンパクトネットワークである。 OMSは画像の忠実度を高め、トレーニングと推論の二分法を調和させ、元のモデルパラメータを保存する。トレーニングが完了すると、同じ潜在ドメインを持つ様々な事前訓練された拡散モデルが同じOMSモジュールを共有することができる。
論文参考訳（メタデータ） (2023-11-27T12:02:42Z)
Towards More Accurate Diffusion Model Acceleration with A Timestep Aligner [84.97253871387028]
数千のデノナイジングステップを用いて画像を生成するために定式化された拡散モデルは通常、遅い推論速度に悩まされる。最小限のコストで特定の区間に対するより正確な積分方向を見つけるのに役立つ時間ステップ整合器を提案する。実験により,我々のプラグイン設計を効率的に訓練し,様々な最先端加速度法の推論性能を向上できることが示された。
論文参考訳（メタデータ） (2023-10-14T02:19:07Z)
Diffusion Models for Accurate Channel Distribution Generation [19.80498913496519]
強力な生成モデルはチャネル分布を正確に学習することができる。これにより、チャネルの物理的測定の繰り返しコストを削減できる。結果として得られる差別化チャネルモデルは、勾配ベースの最適化を可能にすることにより、ニューラルエンコーダのトレーニングをサポートする。
論文参考訳（メタデータ） (2023-09-19T10:35:54Z)
Simultaneous Image-to-Zero and Zero-to-Noise: Diffusion Models with Analytical Image Attenuation [53.04220377034574]
高品質(未条件)な画像生成のための前方拡散プロセスに解析的画像減衰プロセスを導入することを提案する。本手法は,フォワード画像からノイズへのマッピングを,テクスチメジからゼロへのマッピングとテクスティケロ・ツー・ノイズマッピングの同時マッピングとして表現する。我々は,CIFAR-10やCelebA-HQ-256などの無条件画像生成や,超解像,サリエンシ検出,エッジ検出,画像インペインティングなどの画像条件下での下流処理について実験を行った。
論文参考訳（メタデータ） (2023-06-23T18:08:00Z)
Semi-Implicit Denoising Diffusion Models (SIDDMs) [50.30163684539586]
Denoising Diffusion Probabilistic Models (DDPM)のような既存のモデルは、高品質で多様なサンプルを提供するが、本質的に多くの反復的なステップによって遅くなる。暗黙的要因と明示的要因を一致させることにより、この問題に対処する新しいアプローチを導入する。提案手法は拡散モデルに匹敵する生成性能と,少数のサンプリングステップを持つモデルに比較して非常に優れた結果が得られることを示す。
論文参考訳（メタデータ） (2023-06-21T18:49:22Z)
Common Diffusion Noise Schedules and Sample Steps are Flawed [7.802281665410233]
拡散ノイズスケジュールは、信号対雑音比がゼロになる最後の段階を強制しない。拡散サンプリングの実装は、最後の段階から始まりません。既存の実装において、欠陥のある設計が真の問題を引き起こすことを示す。
論文参考訳（メタデータ） (2023-05-15T12:21:08Z)
A Variational Perspective on Solving Inverse Problems with Diffusion Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。そこで我々は,真の後続分布を近似する設計手法を提案する。
論文参考訳（メタデータ） (2023-05-07T23:00:47Z)
Q-Diffusion: Quantizing Diffusion Models [52.978047249670276]
ポストトレーニング量子化(PTQ)は、他のタスクに対するゴーツー圧縮法であると考えられている。本稿では,一意なマルチステップパイプラインとモデルアーキテクチャに適した新しいPTQ手法を提案する。提案手法は,完全精度の非条件拡散モデルを同等の性能を維持しつつ4ビットに定量化できることを示す。
論文参考訳（メタデータ） (2023-02-08T19:38:59Z)
Generative Time Series Forecasting with Diffusion, Denoise, and Disentanglement [51.55157852647306]
時系列予測は多くのアプリケーションにおいて非常に重要な課題である。実世界の時系列データが短時間に記録されることが一般的であり、これはディープモデルと限られたノイズのある時系列との間に大きなギャップをもたらす。本稿では,生成モデルを用いた時系列予測問題に対処し,拡散,雑音,ゆがみを備えた双方向変分自動エンコーダを提案する。
論文参考訳（メタデータ） (2023-01-08T12:20:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。