論文の概要: Simpler is better: spectral regularization and up-sampling techniques
for variational autoencoders
- arxiv url: http://arxiv.org/abs/2201.07544v1
- Date: Wed, 19 Jan 2022 11:49:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-20 13:46:03.670256
- Title: Simpler is better: spectral regularization and up-sampling techniques
for variational autoencoders
- Title(参考訳): より簡単:変分オートエンコーダのスペクトル正規化とアップサンプリング技術
- Authors: Sara Bj\"ork, Jonas Nordhaug Myhre and Thomas Haugland Johansen
- Abstract要約: ニューラルネットワークに基づく生成モデルのスペクトル挙動のキャラクタリゼーションは未解決のままである。
最近の研究は、生成的対向ネットワークと、実画像と生成画像の高周波の相違に重点を置いている。
変分オートエンコーダ(VAE)のための単純な2次元フーリエ変換に基づくスペクトル正規化損失を提案する。
- 参考スコア(独自算出の注目度): 1.2234742322758418
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Full characterization of the spectral behavior of generative models based on
neural networks remains an open issue. Recent research has focused heavily on
generative adversarial networks and the high-frequency discrepancies between
real and generated images. The current solution to avoid this is to either
replace transposed convolutions with bilinear up-sampling or add a spectral
regularization term in the generator. It is well known that Variational
Autoencoders (VAEs) also suffer from these issues. In this work, we propose a
simple 2D Fourier transform-based spectral regularization loss for the VAE and
show that it can achieve results equal to, or better than, the current
state-of-the-art in frequency-aware losses for generative models. In addition,
we experiment with altering the up-sampling procedure in the generator network
and investigate how it influences the spectral performance of the model. We
include experiments on synthetic and real data sets to demonstrate our results.
- Abstract(参考訳): ニューラルネットワークに基づく生成モデルのスペクトル挙動の完全な評価は未解決のままである。
最近の研究は、生成的対向ネットワークと、実画像と生成画像の高周波の相違に重点を置いている。
これを回避する現在の解決策は、変換された畳み込みをバイリニアアップサンプリングに置き換えるか、ジェネレータにスペクトル正規化項を追加するかである。
変分オートエンコーダ(VAE)もこれらの問題に悩まされていることはよく知られている。
本研究では,VAEの2次元フーリエ変換に基づくスペクトル正規化損失を簡易に提案し,生成モデルにおける周波数認識損失の現況と同等かそれ以上の結果が得られることを示す。
さらに,ジェネレータネットワークにおけるアップサンプリング手法の変更を試み,それがモデルのスペクトル性能に与える影響について検討した。
結果を示すために、合成および実データ集合の実験を含む。
関連論文リスト
- Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Spectrum Translation for Refinement of Image Generation (STIG) Based on
Contrastive Learning and Spectral Filter Profile [15.5188527312094]
生成した画像の周波数領域における相違を緩和する枠組みを提案する。
これは、コントラスト学習に基づく画像生成(STIG)の洗練のためのスペクトル変換によって実現される。
我々は,STIGの有効性を実証するために,8つのフェイク画像データセットと様々な最先端モデルにまたがるフレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-03-08T06:39:24Z) - Graph Generation via Spectral Diffusion [51.60814773299899]
本稿では,1)グラフラプラシア行列のスペクトル分解と2)拡散過程に基づく新しいグラフ生成モデルGRASPを提案する。
具体的には、固有ベクトルと固有値のサンプリングにデノナイジングモデルを用い、グラフラプラシアン行列と隣接行列を再構成する。
我々の置換不変モデルは各ノードの固有ベクトルに連結することでノードの特徴を扱える。
論文 参考訳(メタデータ) (2024-02-29T09:26:46Z) - Deep Spectral Meshes: Multi-Frequency Facial Mesh Processing with Graph
Neural Networks [1.170907599257096]
メッシュ変形を低周波・高周波変形に分解する手法として,スペクトルメッシュを導入した。
提案フレームワーク上に3次元顔メッシュ合成のためのパラメトリックモデルを構築した。
このモデルでは、異なる周波数レベルを異なる、より適切な表現で表現することで、スペクトル分割をさらに活用する。
論文 参考訳(メタデータ) (2024-02-15T23:17:08Z) - Short-Time Fourier Transform for deblurring Variational Autoencoders [0.0]
変分オートエンコーダ(VAE)は強力な生成モデルである。
彼らの生成したサンプルは、代替生成技術の出力と比較して、特徴的な曖昧さに悩まされていることが知られている。
論文 参考訳(メタデータ) (2024-01-06T08:57:11Z) - Degradation-Noise-Aware Deep Unfolding Transformer for Hyperspectral
Image Denoising [9.119226249676501]
ハイパースペクトル画像(HSI)は、帯域幅が狭いため、ノイズが多いことが多い。
HSIデータキューブのノイズを低減するため、モデル駆動型と学習型の両方の復調アルゴリズムが提案されている。
本稿では,これらの問題に対処するDNA-Net(Degradation-Noise-Aware Unfolding Network)を提案する。
論文 参考訳(メタデータ) (2023-05-06T13:28:20Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with
Adaptive Noise Spectral Shaping [51.698273019061645]
SpecGradは拡散雑音に適応し、その時間変化スペクトル包絡が条件付き対数メル分光器に近づく。
時間周波数領域で処理され、計算コストは従来のDDPMベースのニューラルボコーダとほぼ同じである。
論文 参考訳(メタデータ) (2022-03-31T02:08:27Z) - Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction [138.04956118993934]
本稿では, サース・トゥ・ファインス・スパース・トランス (CST) を用いた新しいトランス方式を提案する。
HSI再構成のための深層学習にHSI空間を埋め込んだCST
特に,CSTは,提案したスペクトル認識スクリーニング機構(SASM)を粗いパッチ選択に使用し,選択したパッチを,細かなピクセルクラスタリングと自己相似性キャプチャのために,カスタマイズしたスペクトル集約ハッシュ型マルチヘッド自己アテンション(SAH-MSA)に入力する。
論文 参考訳(メタデータ) (2022-03-09T16:17:47Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - Watch your Up-Convolution: CNN Based Generative Deep Neural Networks are
Failing to Reproduce Spectral Distributions [13.439086686599891]
上向きの畳み込みあるいは転置畳み込みは、そのようなモデルが自然学習データのスペクトル分布を正確に再現できないことを示します。
トレーニング最適化の目的に新しいスペクトル正規化項を加えることを提案する。
提案手法は,周波数誤差を回避したスペクトル一貫したGANの訓練を可能にする。
論文 参考訳(メタデータ) (2020-03-03T23:04:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。