論文の概要: Wavelet Knowledge Distillation: Towards Efficient Image-to-Image
Translation
- arxiv url: http://arxiv.org/abs/2203.06321v1
- Date: Sat, 12 Mar 2022 02:42:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 14:09:01.495659
- Title: Wavelet Knowledge Distillation: Towards Efficient Image-to-Image
Translation
- Title(参考訳): wavelet knowledge distillation:効率的な画像から画像への変換に向けて
- Authors: Linfeng Zhang, Xin Chen, Xiaobing Tu, Pengfei Wan, Ning Xu, Kaisheng
Ma
- Abstract要約: 本稿では,周波数から見たGANの性能について検討する。
その結果, GAN, 特に小型 GAN は高品質な高周波情報を生成できないことがわかった。
本稿ではウェーブレット知識蒸留と呼ばれる新しい知識蒸留法を提案する。
- 参考スコア(独自算出の注目度): 22.841122397104265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remarkable achievements have been attained with Generative Adversarial
Networks (GANs) in image-to-image translation. However, due to a tremendous
amount of parameters, state-of-the-art GANs usually suffer from low efficiency
and bulky memory usage. To tackle this challenge, firstly, this paper
investigates GANs performance from a frequency perspective. The results show
that GANs, especially small GANs lack the ability to generate high-quality high
frequency information. To address this problem, we propose a novel knowledge
distillation method referred to as wavelet knowledge distillation. Instead of
directly distilling the generated images of teachers, wavelet knowledge
distillation first decomposes the images into different frequency bands with
discrete wavelet transformation and then only distills the high frequency
bands. As a result, the student GAN can pay more attention to its learning on
high frequency bands. Experiments demonstrate that our method leads to 7.08
times compression and 6.80 times acceleration on CycleGAN with almost no
performance drop. Additionally, we have studied the relation between
discriminators and generators which shows that the compression of
discriminators can promote the performance of compressed generators.
- Abstract(参考訳): 画像と画像の翻訳において、GAN(Generative Adversarial Networks)で注目すべき成果が得られた。
しかし、非常に多くのパラメータがあるため、最先端のGANは通常、低効率とバルクメモリの使用に悩まされる。
この課題に対処するために、まず、周波数の観点からGANの性能について検討する。
その結果, GAN, 特に小型 GAN は高品質な高周波情報を生成できないことがわかった。
そこで本研究では,ウェーブレット知識蒸留と呼ばれる新しい知識蒸留法を提案する。
教師が生成した画像を直接蒸留する代わりに、ウェーブレット知識蒸留はまず個々のウェーブレット変換で異なる周波数帯域に分解し、次に高周波帯域のみを蒸留する。
その結果、学生ganは高周波帯域での学習により多くの注意を払うことができる。
実験の結果,CycleGANの圧縮は7.08倍,アクセラレーションは6.80倍となり,性能低下はほとんどなかった。
さらに, 識別器と生成器の関係について検討し, 識別器の圧縮が圧縮発生器の性能を促進できることを示した。
関連論文リスト
- One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - FreGS: 3D Gaussian Splatting with Progressive Frequency Regularization [67.47895278233717]
周波数空間における過度再構成問題に対処するために, 進行周波数正規化手法を開発した。
FreGSは優れた斬新なビュー合成を実現し、最先端の技術を一貫して上回っている。
論文 参考訳(メタデータ) (2024-03-11T17:00:27Z) - FreeKD: Knowledge Distillation via Semantic Frequency Prompt [33.28298466424745]
周波数蒸留における最適な局所化と範囲を決定するための周波数知識蒸留法をFreeKDとして提案する。
また,高密度予測タスクに対して位置認識型リレーショナル周波数損失を用い,高次空間拡張を学生モデルに提供する。
論文 参考訳(メタデータ) (2023-11-20T08:06:41Z) - WaveGAN: Frequency-aware GAN for High-Fidelity Few-shot Image Generation [3.5459430566117893]
本稿では,数ショット画像生成のための周波数認識モデルであるWaveGANを提案する。
我々は、高周波スキップ接続を用いることで、細部を合成するジェネレータの苦労を軽減する。
FID 42.17, LPIPS 0.3868, FID 30.35, LPIPS 0.5076, FID 4.96, LPIPS 0.3822をそれぞれ, フラワー, アニマルフェイス, VGGFaceで実現した。
論文 参考訳(メタデータ) (2022-07-15T04:39:47Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - On the Frequency Bias of Generative Models [61.60834513380388]
我々は、最先端のGANトレーニングにおいて、高周波アーティファクトに対する提案手法を解析した。
既存のアプローチでは、スペクトルアーティファクトを完全に解決できないことが分かっています。
以上の結果から,識別能力の向上に大きな可能性があることが示唆された。
論文 参考訳(メタデータ) (2021-11-03T18:12:11Z) - Are High-Frequency Components Beneficial for Training of Generative
Adversarial Networks [11.226288436817956]
GAN(Generative Adversarial Networks)は、実際の画像と視覚的に区別できない現実的な画像を生成する能力を持つ。
画像スペクトルの最近の研究は、生成画像と実画像が高周波で有意な差を持つことを示した。
GAN訓練における高周波差を除去する2つの前処理手法を提案する。
論文 参考訳(メタデータ) (2021-03-20T04:37:06Z) - Noise Homogenization via Multi-Channel Wavelet Filtering for
High-Fidelity Sample Generation in GANs [47.92719758687014]
GAN(Generative Adversarial Networks)のための新しいマルチチャネルウェーブレットに基づくフィルタリング手法を提案する。
ジェネレータにウェーブレットのデコンボリューション層を埋め込むと、結果のGANであるWaveletGANがウェーブレットのデコンボリューションを利用して複数のチャネルによるフィルタリングを学習する。
オープンGANベンチマークツールを用いて,Fashion-MNIST,KMNIST,SVHNデータセットのベンチマーク実験を行った。
論文 参考訳(メタデータ) (2020-05-14T03:40:11Z) - Blur, Noise, and Compression Robust Generative Adversarial Networks [85.68632778835253]
劣化画像から直接クリーンな画像生成装置を学習するために, ぼかし, ノイズ, 圧縮堅牢なGAN(BNCR-GAN)を提案する。
NR-GANにインスパイアされたBNCR-GANは、画像、ぼやけたカーネル、ノイズ、品質要素ジェネレータで構成される多重ジェネレータモデルを使用する。
CIFAR-10の大規模比較とFFHQの一般性解析によるBNCR-GANの有効性を実証する。
論文 参考訳(メタデータ) (2020-03-17T17:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。