論文の概要: GIU-GANs: Global Information Utilization for Generative Adversarial
Networks
- arxiv url: http://arxiv.org/abs/2201.10471v1
- Date: Tue, 25 Jan 2022 17:17:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 16:16:48.445109
- Title: GIU-GANs: Global Information Utilization for Generative Adversarial
Networks
- Title(参考訳): giu-gans: 生成型adversarial networkにおけるグローバル情報利用
- Authors: Yongqi Tian, Xueyuan Gong, Jialin Tang, Binghua Su, Xiaoxiang Liu,
Xinyuan Zhang
- Abstract要約: 本稿では,Involution Generative Adversarial Networks (GIU-GANs) と呼ばれる新しいGANを提案する。
GIU-GANは、Squeeze-and-Excitation Networks (SENet)とInvolutionを統合したGlobal Information utilization (GIU)モジュールと呼ばれる新しいモジュールを利用している。
バッチ正規化(BN)は、ジェネレータがサンプリングしたノイズ間の表現差を必然的に無視し、生成した画質を劣化させる。
- 参考スコア(独自算出の注目度): 3.3945834638760948
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, with the rapid development of artificial intelligence, image
generation based on deep learning has dramatically advanced. Image generation
based on Generative Adversarial Networks (GANs) is a promising study. However,
since convolutions are limited by spatial-agnostic and channel-specific,
features extracted by traditional GANs based on convolution are constrained.
Therefore, GANs are unable to capture any more details per image. On the other
hand, straightforwardly stacking of convolutions causes too many parameters and
layers in GANs, which will lead to a high risk of overfitting. To overcome the
aforementioned limitations, in this paper, we propose a new GANs called
Involution Generative Adversarial Networks (GIU-GANs). GIU-GANs leverages a
brand new module called the Global Information Utilization (GIU) module, which
integrates Squeeze-and-Excitation Networks (SENet) and involution to focus on
global information by channel attention mechanism, leading to a higher quality
of generated images. Meanwhile, Batch Normalization(BN) inevitably ignores the
representation differences among noise sampled by the generator, and thus
degrade the generated image quality. Thus we introduce Representative Batch
Normalization(RBN) to the GANs architecture for this issue. The CIFAR-10 and
CelebA datasets are employed to demonstrate the effectiveness of our proposed
model. A large number of experiments prove that our model achieves
state-of-the-art competitive performance.
- Abstract(参考訳): 近年,人工知能の急速な発展に伴い,ディープラーニングに基づく画像生成が飛躍的に進歩している。
GAN(Generative Adversarial Networks)に基づく画像生成は有望な研究である。
しかし、畳み込みは空間認識やチャネル固有性によって制限されるため、畳み込みに基づく従来のGANによって抽出された特徴は制約される。
したがって、GANは画像ごとにそれ以上の詳細をキャプチャできない。
一方、簡単に畳み込みを積み重ねると、GANのパラメータや層が多すぎるため、過度に適合するリスクが高くなります。
本稿では,これらの制約を克服するため,新たなGAN(Involution Generative Adversarial Networks)を提案する。
GIU-GANは、Squeeze-and-Excitation Networks (SENet)とインボリューションを統合して、チャネルアテンション機構によるグローバル情報にフォーカスするGlobal Information utilization (GIU)モジュールと呼ばれる、新しいモジュールを活用する。
一方、バッチ正規化(BN)は、生成元がサンプリングしたノイズの表現差を必然的に無視し、生成した画質を劣化させる。
そこで我々は,この問題に対するGANアーキテクチャに代表バッチ正規化(RBN)を導入する。
cifar-10とcelebaデータセットを用いて,提案モデルの有効性を示す。
多くの実験により、我々のモデルが最先端の競争性能を達成することが証明された。
関連論文リスト
- U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [48.40120035775506]
Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文 参考訳(メタデータ) (2024-06-05T04:13:03Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - Intriguing Property and Counterfactual Explanation of GAN for Remote Sensing Image Generation [25.96740500337747]
GAN(Generative Adversarial Network)は、自然画像の分野で顕著な進歩を遂げている。
GANモデルは、自然な画像生成よりも、RS画像生成のためのトレーニングデータのサイズに敏感である。
本稿では,一様正則化(UR)とエントロピー正則化(ER)という2つの革新的な調整手法を提案する。
論文 参考訳(メタデータ) (2023-03-09T13:22:50Z) - TcGAN: Semantic-Aware and Structure-Preserved GANs with Individual
Vision Transformer for Fast Arbitrary One-Shot Image Generation [11.207512995742999]
画像の内部パッチから学習する生成的敵ネットワークを持つワンショット画像生成(OSG)は、世界中で注目を集めている。
本稿では,既存のワンショット画像生成手法の欠点を克服するために,個々の視覚変換器を用いた構造保存方式TcGANを提案する。
論文 参考訳(メタデータ) (2023-02-16T03:05:59Z) - Latent Multi-Relation Reasoning for GAN-Prior based Image
Super-Resolution [61.65012981435095]
LARENはグラフベースの非絡み合いであり、階層的マルチリレーショナル推論によってより優れた非絡み合い空間を構築する。
我々は、LARENが優れた大因子画像SRを実現し、複数のベンチマークで常に最先端の性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-08-04T19:45:21Z) - Unsupervised Image Generation with Infinite Generative Adversarial
Networks [24.41144953504398]
無限条件GANまたはMIC-GANを混合した非教師なし非パラメトリック手法を提案する。
MIC-GANは潜伏空間の構造化やモード崩壊の回避に有効であることを示す。
論文 参考訳(メタデータ) (2021-08-18T05:03:19Z) - Towards Discovery and Attribution of Open-world GAN Generated Images [18.10496076534083]
本稿では,未確認のGANから生成した画像の反復的探索アルゴリズムを提案する。
アルゴリズムはネットワークトレーニング,分散検出,クラスタリング,マージ,洗練といった複数のコンポーネントで構成されている。
私たちの実験は、新しいganを発見し、オープンワールドのセットアップで使用できるアプローチの有効性を示しています。
論文 参考訳(メタデータ) (2021-05-10T18:00:13Z) - Best-Buddy GANs for Highly Detailed Image Super-Resolution [71.13466303340192]
我々は,低分解能(LR)入力に基づいて高分解能(HR)画像を生成する単一画像超解像(SISR)問題を考える。
このラインに沿ったほとんどのメソッドは、SISRタスクに十分な柔軟性がない、事前定義されたシングルLRシングルHRマッピングに依存しています。
リッチディテールSISRのためのベストバディGAN(Beby-GAN)を提案する。
イミュータブルな1対1の制約を緩和することで、推定されたパッチを動的に最高の監視を求めることができる。
論文 参考訳(メタデータ) (2021-03-29T02:58:27Z) - CoDeGAN: Contrastive Disentanglement for Generative Adversarial Network [0.5437298646956507]
解釈可能な機械学習において重要な関心事であるディスタングルメントもまた、コンピュータビジョンコミュニティから大きな注目を集めている。
我々はtextttCoDeGAN を提案し、画像領域から特徴領域への切り離しに関する類似性制約を緩和する。
我々はCoDeGANに自己教師付き事前学習を統合して意味表現を学習し、教師なしの絡み合いを著しく促進する。
論文 参考訳(メタデータ) (2021-03-05T12:44:22Z) - Guiding GANs: How to control non-conditional pre-trained GANs for
conditional image generation [69.10717733870575]
本稿では,汎用非条件GANを条件GANとして振る舞うための新しい方法を提案する。
提案手法は,非条件GANのジェネレータネットワークに供給される高次元ランダム入力を生成するために,エンコーダネットワークを混合するものである。
論文 参考訳(メタデータ) (2021-01-04T14:03:32Z) - A U-Net Based Discriminator for Generative Adversarial Networks [86.67102929147592]
GAN(Generative Adversarial Network)のための代替U-Netベースの識別器アーキテクチャを提案する。
提案アーキテクチャにより,合成画像のグローバルコヒーレンスを維持しつつ,画素単位の詳細なフィードバックを生成元に提供することができる。
斬新な判別器は、標準分布と画像品質の指標の観点から、最先端の技術を向上する。
論文 参考訳(メタデータ) (2020-02-28T11:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。