論文の概要: Noise Homogenization via Multi-Channel Wavelet Filtering for
High-Fidelity Sample Generation in GANs
- arxiv url: http://arxiv.org/abs/2005.06707v1
- Date: Thu, 14 May 2020 03:40:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 04:12:12.702845
- Title: Noise Homogenization via Multi-Channel Wavelet Filtering for
High-Fidelity Sample Generation in GANs
- Title(参考訳): マルチチャネルウェーブレットフィルタによるGANの高密度サンプル生成のためのノイズ均質化
- Authors: Shaoning Zeng and Bob Zhang
- Abstract要約: GAN(Generative Adversarial Networks)のための新しいマルチチャネルウェーブレットに基づくフィルタリング手法を提案する。
ジェネレータにウェーブレットのデコンボリューション層を埋め込むと、結果のGANであるWaveletGANがウェーブレットのデコンボリューションを利用して複数のチャネルによるフィルタリングを学習する。
オープンGANベンチマークツールを用いて,Fashion-MNIST,KMNIST,SVHNデータセットのベンチマーク実験を行った。
- 参考スコア(独自算出の注目度): 47.92719758687014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the generator of typical Generative Adversarial Networks (GANs), a noise
is inputted to generate fake samples via a series of convolutional operations.
However, current noise generation models merely relies on the information from
the pixel space, which increases the difficulty to approach the target
distribution. Fortunately, the long proven wavelet transformation is able to
decompose multiple spectral information from the images. In this work, we
propose a novel multi-channel wavelet-based filtering method for GANs, to cope
with this problem. When embedding a wavelet deconvolution layer in the
generator, the resultant GAN, called WaveletGAN, takes advantage of the wavelet
deconvolution to learn a filtering with multiple channels, which can
efficiently homogenize the generated noise via an averaging operation, so as to
generate high-fidelity samples. We conducted benchmark experiments on the
Fashion-MNIST, KMNIST and SVHN datasets through an open GAN benchmark tool. The
results show that WaveletGAN has excellent performance in generating
high-fidelity samples, thanks to the smallest FIDs obtained on these datasets.
- Abstract(参考訳): GAN(Generative Adversarial Networks)のジェネレータでは、一連の畳み込み操作によって偽のサンプルを生成するためにノイズが入力される。
しかし、現在のノイズ生成モデルは、単にピクセル空間からの情報に依存するため、ターゲット分布に近づくことの困難さが増すだけである。
幸いにも、長い証明されたウェーブレット変換は、画像から複数のスペクトル情報を分解することができる。
本研究では,GANに対する新しいマルチチャネルウェーブレットフィルタリング手法を提案し,この問題に対処する。
ウェーブレットデコンボリューション層をジェネレータに埋め込むと、ウェーブレットデコンボリューションを利用して複数のチャネルによるフィルタリングを学習し、平均演算により生成されたノイズを効率的に均質化し、高忠実なサンプルを生成する。
オープンGANベンチマークツールを用いて,Fashion-MNIST,KMNIST,SVHNデータセットのベンチマーク実験を行った。
その結果、WaveletGANは、これらのデータセットで得られた最小のFIDのおかげで、高忠実度サンプルを生成するのに優れた性能を示した。
関連論文リスト
- Multi-scale Generative Modeling for Fast Sampling [38.570968785490514]
ウェーブレット領域では、特に高周波係数のスパース表現が独特な課題に直面している。
本稿では、低周波帯と高周波帯を扱うための異なる戦略を用いるウェーブレット領域におけるマルチスケール生成モデルを提案する。
理論的解析と実験結果により,本モデルは性能を著しく向上させ,トレーニング可能なパラメータの数,サンプリングステップ,時間を削減する。
論文 参考訳(メタデータ) (2024-11-14T11:01:45Z) - Frequency-aware Feature Fusion for Dense Image Prediction [99.85757278772262]
本稿では,高密度画像予測のための周波数認識機能融合(FreqFusion)を提案する。
FreqFusionは、Adaptive Low-Pass Filter (ALPF) ジェネレータ、オフセットジェネレータ、Adaptive High-Pass Filter (AHPF) ジェネレータを統合する。
包括的可視化と定量的分析は、FreqFusionが機能一貫性を効果的に改善し、オブジェクト境界を鋭くすることを示している。
論文 参考訳(メタデータ) (2024-08-23T07:30:34Z) - Score-based Generative Models with Adaptive Momentum [40.84399531998246]
変換過程を高速化する適応運動量サンプリング法を提案する。
提案手法は,2倍から5倍の速度で,より忠実な画像/グラフを小さなサンプリングステップで作成できることを示す。
論文 参考訳(メタデータ) (2024-05-22T15:20:27Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Simpler is better: spectral regularization and up-sampling techniques
for variational autoencoders [1.2234742322758418]
ニューラルネットワークに基づく生成モデルのスペクトル挙動のキャラクタリゼーションは未解決のままである。
最近の研究は、生成的対向ネットワークと、実画像と生成画像の高周波の相違に重点を置いている。
変分オートエンコーダ(VAE)のための単純な2次元フーリエ変換に基づくスペクトル正規化損失を提案する。
論文 参考訳(メタデータ) (2022-01-19T11:49:57Z) - Unified Source-Filter GAN: Unified Source-filter Network Based On
Factorization of Quasi-Periodic Parallel WaveGAN [36.12470085926042]
本稿では,単一のニューラルネットワークを用いたデータ駆動型ソースフィルタモデリング手法を提案する。
疑似周期並列波GANを分解して,uSFGAN (Unified Source-filter Generative Adversarial Network) と呼ばれるネットワークを開発した。
実験では、uSFGANがQPPWGやNSFなどの従来のニューラルボコーダを音声品質とピッチ制御性の両方で上回っていることが示された。
論文 参考訳(メタデータ) (2021-04-10T02:38:26Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - Wavelet Integrated CNNs for Noise-Robust Image Classification [51.18193090255933]
我々は、離散ウェーブレット変換(DWT)により、最大プール、ストライド畳み込み、平均プールを置き換えることでCNNを強化する。
VGG、ResNets、DenseNetのウェーブレット統合バージョンであるWaveCNetsは、バニラバージョンよりも精度が高く、ノイズ・ロバスト性も向上している。
論文 参考訳(メタデータ) (2020-05-07T09:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。