論文の概要: A Unified GAN Framework Regarding Manifold Alignment for Remote Sensing
Images Generation
- arxiv url: http://arxiv.org/abs/2305.19507v2
- Date: Fri, 14 Jul 2023 07:57:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-17 16:38:53.661956
- Title: A Unified GAN Framework Regarding Manifold Alignment for Remote Sensing
Images Generation
- Title(参考訳): リモートセンシング画像生成のためのマニフォールドアライメントに関する統一GANフレームワーク
- Authors: Xingzhe Su, Wenwen Qiang, Zeen Song, Changwen Zheng, Fengge Wu, Fuchun
Sun
- Abstract要約: GAN(Generative Adversarial Networks)とGAN(Generative Adversarial Networks)は、自然画像において顕著な成功を収めている。
GANとその変種は、リモートセンシング(RS)画像に適用する場合、過度に適合する問題に悩まされることが多い。
そこで本研究では, 判別器の制約とモデル性能の向上のために, 実データ多様体を利用する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 13.171661917672852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GANs) and their variants have achieved
remarkable success on natural images. However, their performance degrades when
applied to remote sensing (RS) images, and the discriminator often suffers from
the overfitting problem. In this paper, we examine the differences between
natural and RS images and find that the intrinsic dimensions of RS images are
much lower than those of natural images. As the discriminator is more
susceptible to overfitting on data with lower intrinsic dimension, it focuses
excessively on local characteristics of RS training data and disregards the
overall structure of the distribution, leading to a faulty generation model. In
respond, we propose a novel approach that leverages the real data manifold to
constrain the discriminator and enhance the model performance. Specifically, we
introduce a learnable information-theoretic measure to capture the real data
manifold. Building upon this measure, we propose manifold alignment
regularization, which mitigates the discriminator's overfitting and improves
the quality of generated samples. Moreover, we establish a unified GAN
framework for manifold alignment, applicable to both supervised and
unsupervised RS image generation tasks.
- Abstract(参考訳): GAN(Generative Adversarial Networks)とその変種は自然画像において顕著な成功を収めている。
しかし、その性能はリモートセンシング(rs)画像に適用すると劣化し、判別器はしばしば過フィッティング問題に苦しむ。
本稿では,自然画像と自然画像の差異を調べ,rs画像の固有寸法が自然画像のそれよりもずっと低いことを明らかにする。
判別器は、本質的な次元の低いデータに過度に適合する傾向にあるため、RSトレーニングデータの局所的特性に過度に焦点を合わせ、分布の全体構造を無視し、不良生成モデルに繋がる。
そこで本研究では,実データを用いた判別器の制約とモデル性能の向上を目的とした新しい手法を提案する。
具体的には、実データ多様体を捉えるための学習可能な情報理論測度を導入する。
この尺度に基づいて, 判別器の過度適合を緩和し, 生成サンプルの品質を向上させる多様体アライメント正則化を提案する。
さらに,教師付きおよび教師なしのrs画像生成タスクに適用可能な,多様体アライメントのための統一ganフレームワークを構築した。
関連論文リスト
- DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - Generative Diffusion Prior for Unified Image Restoration and Enhancement [62.76390152617949]
既存の画像復元法は、主に自然画像の後方分布を利用する。
教師なしサンプリング方式で後部分布を効果的にモデル化するための生成拡散優先(GDP)を提案する。
GDPは、線形逆問題、非線形問題、ブラインド問題を解くために、プレトレインデノナイジング拡散生成モデル(DDPM)を利用する。
論文 参考訳(メタデータ) (2023-04-03T16:52:43Z) - Intriguing Property and Counterfactual Explanation of GAN for Remote
Sensing Image Generation [16.05744622269697]
GAN(Generative Adversarial Network)は、自然画像の分野で顕著な進歩を遂げている。
GANモデルは、自然な画像生成よりも、RS画像生成のためのトレーニングデータのサイズに敏感である。
本稿では,一様正則化(UR)とエントロピー正則化(ER)という2つの革新的な調整手法を提案する。
論文 参考訳(メタデータ) (2023-03-09T13:22:50Z) - Latent Space is Feature Space: Regularization Term for GANs Training on
Limited Dataset [1.8634083978855898]
LFMと呼ばれるGANの付加的な構造と損失関数を提案し、潜在空間の異なる次元間の特徴の多様性を最大化するよう訓練した。
実験では、このシステムはDCGAN上に構築されており、CelebAデータセットのスクラッチからFrechet Inception Distance(FID)トレーニングを改善することが証明されている。
論文 参考訳(メタデータ) (2022-10-28T16:34:48Z) - A-ESRGAN: Training Real-World Blind Super-Resolution with Attention
U-Net Discriminators [0.0]
ブラインド画像超解像(SR)は、未知の複雑な歪みに苦しむ低解像度画像の復元を目的とした、CVにおける長年の課題である。
本稿では,A-ESRGANについて述べる。A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN,A-ESRGAN。
論文 参考訳(メタデータ) (2021-12-19T02:50:23Z) - Feature Statistics Mixing Regularization for Generative Adversarial
Networks [13.326288596904208]
生成的敵ネットワークにおいて、識別器の改善は、生成性能の鍵となる要素の一つである。
本稿では,判別器の予測を入力画像のスタイルに不変にするための特徴統計混合正則化(FSMR)を提案する。
我々は、規則化がスタイルに対する感度を低下させ、様々なGANアーキテクチャの性能を一貫して向上させることを示すために、広範囲な実験を行っている。
論文 参考訳(メタデータ) (2021-12-08T05:11:06Z) - A Method for Evaluating Deep Generative Models of Images via Assessing
the Reproduction of High-order Spatial Context [9.00018232117916]
GAN(Generative Adversarial Network)は、広く使われているDGMの一種である。
本稿では,2つのGANアーキテクチャによって出力される画像の客観的なテストについて述べる。
我々は、訓練されたGANによって生成した画像の特徴を再現できるいくつかのコンテキストモデル(SCM)を設計した。
論文 参考訳(メタデータ) (2021-11-24T15:58:10Z) - Style Normalization and Restitution for DomainGeneralization and
Adaptation [88.86865069583149]
効果的なドメイン一般化モデルは、一般化および判別可能な特徴表現を学習することが期待される。
本稿では,ネットワークの高一般化と識別能力を確保するために,新しいスタイル正規化・再構成モジュール(SNR)を設計する。
論文 参考訳(メタデータ) (2021-01-03T09:01:39Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。