論文の概要: Wavelet Flow: Fast Training of High Resolution Normalizing Flows
- arxiv url: http://arxiv.org/abs/2010.13821v1
- Date: Mon, 26 Oct 2020 18:13:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 18:20:57.132498
- Title: Wavelet Flow: Fast Training of High Resolution Normalizing Flows
- Title(参考訳): ウェーブレットフロー:高分解能正規化流れの高速訓練
- Authors: Jason J. Yu, Konstantinos G. Derpanis, Marcus A. Brubaker
- Abstract要約: 本稿では,ウェーブレットに基づくマルチスケール正規化フローアーキテクチャであるWavelet Flowを紹介する。
Wavelet Flowの大きな利点は、以前のモデルでは実現不可能な高解像度データの生成モデルを構築することができることである。
- 参考スコア(独自算出の注目度): 27.661467862732792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Normalizing flows are a class of probabilistic generative models which allow
for both fast density computation and efficient sampling and are effective at
modelling complex distributions like images. A drawback among current methods
is their significant training cost, sometimes requiring months of GPU training
time to achieve state-of-the-art results. This paper introduces Wavelet Flow, a
multi-scale, normalizing flow architecture based on wavelets. A Wavelet Flow
has an explicit representation of signal scale that inherently includes models
of lower resolution signals and conditional generation of higher resolution
signals, i.e., super resolution. A major advantage of Wavelet Flow is the
ability to construct generative models for high resolution data (e.g., 1024 x
1024 images) that are impractical with previous models. Furthermore, Wavelet
Flow is competitive with previous normalizing flows in terms of bits per
dimension on standard (low resolution) benchmarks while being up to 15x faster
to train.
- Abstract(参考訳): 正規化フローは、高速密度計算と効率的なサンプリングの両方を可能にし、画像のような複雑な分布のモデリングに有効である確率的生成モデルの一種である。
現在の方法の欠点は、トレーニングコストの大幅な向上であり、最新の結果を得るためには、数ヶ月のgpuトレーニング時間を要する場合もある。
本稿では,ウェーブレットに基づくマルチスケール正規化フローアーキテクチャであるWavelet Flowを紹介する。
ウェーブレットフローは信号スケールの明示的な表現を持ち、これは本質的には低解像度信号のモデルと高解像度信号、すなわち超解像度信号の条件生成を含む。
ウェーブレットフローの大きな利点は、以前のモデルと非現実的な高解像度データ(例えば、1024 x 1024画像)の生成モデルを構築する能力である。
さらに、Wavelet Flowは、標準(低解像度)ベンチマークで1次元当たりのビット数で従来の正規化フローと競合する一方で、トレーニングの最大15倍高速である。
関連論文リスト
- Fast constrained sampling in pre-trained diffusion models [77.21486516041391]
拡散モデルは、大規模な生成画像モデルの分野を支配してきた。
本研究では,大規模な事前学習拡散モデルにおける高速拘束サンプリングのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow [65.51671121528858]
拡散モデルは、視覚生成を大幅に改善したが、生成ODEを解くという計算集約的な性質のため、生成速度の遅さによって妨げられている。
広く認識されている解である整流流は、ODEパスを直線化することで生成速度を向上させる。
本稿では,より広範な拡散モデルのカテゴリをカバーするために,設計空間と修正の応用範囲を一般化するRectified Diffusionを提案する。
論文 参考訳(メタデータ) (2024-10-09T17:43:38Z) - FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner [70.90505084288057]
フローベースモデルはサンプリングプロセス中により直線的なサンプリング軌道を生成する傾向にある。
擬似修正器やサンプル認識コンパイルなどいくつかの手法を導入し,推論時間をさらに短縮する。
FlowTurboはImageNet上で100(ms/img)で2.12FID、38(ms/img)で3.93FIDに達する
論文 参考訳(メタデータ) (2024-09-26T17:59:51Z) - Accelerating High-Fidelity Waveform Generation via Adversarial Flow Matching Optimization [37.35829410807451]
本稿では,逆流マッチング最適化による高忠実かつ高効率な波形生成モデルである PeriodWave-Turbo を提案する。
さまざまな客観的メトリクスで最先端のパフォーマンスを達成するには、1,000ステップの微調整しか必要ありません。
PeriodWave のバックボーンを 29M から 70M のパラメータにスケールアップすることで、一般化を改善することで、 PeriodWave-Turbo は前例のない性能を実現している。
論文 参考訳(メタデータ) (2024-08-15T08:34:00Z) - PeRFlow: Piecewise Rectified Flow as Universal Plug-and-Play Accelerator [73.80050807279461]
Piecewise Rectified Flow (PeRFlow) は拡散モデルの高速化のためのフローベース手法である。
PeRFlowは数ステップの世代で優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-05-13T07:10:53Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Learning Non-linear Wavelet Transformation via Normalizing Flow [0.0]
可逆変換は設計された正規化フローモデルによって学習することができる。
ウェーブレットダウンサンプリング機構に似たファクターアウトスキームにより、高速パターンに対応するファクターアウト変数に正規化フローモデルを訓練することができる。
低域/高域フィルタを用いた学習モデルの解析を行う。
論文 参考訳(メタデータ) (2021-01-27T10:28:51Z) - WaveNODE: A Continuous Normalizing Flow for Speech Synthesis [15.051929807285847]
本稿では,音声合成のための連続正規化フローを利用するWaveNODEと呼ばれる新しい生成モデルを提案する。
WaveNODEはフロー操作に使用する関数に制約を課さないため、より柔軟で複雑な関数を使用することができる。
本研究では,従来のフローベースボコーダに比べて少ないパラメータでウェーブヌードが同等の性能を発揮することを示す。
論文 参考訳(メタデータ) (2020-06-08T13:49:36Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。