論文の概要: A Novel Generator with Auxiliary Branch for Improving GAN Performance
- arxiv url: http://arxiv.org/abs/2112.14968v2
- Date: Sat, 3 Feb 2024 00:27:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 07:27:53.823591
- Title: A Novel Generator with Auxiliary Branch for Improving GAN Performance
- Title(参考訳): gan性能向上のための補助分岐付き新規発電機
- Authors: Seung Park and Yong-Goo Shin
- Abstract要約: 本稿では、2つの異なるブランチから得られた特徴を組み合わせることで、画像を生成する新しいジェネレータアーキテクチャを紹介する。
メインブランチの目標は、複数の残留ブロックを通り抜けて画像を生成することであり、補助ブランチは、前のレイヤの粗い情報を後層に伝達することである。
提案手法の優位性を証明するため, 各種標準データセットを用いた広範囲な実験を行った。
- 参考スコア(独自算出の注目度): 7.005458308454871
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generator in the generative adversarial network (GAN) learns image
generation in a coarse-to-fine manner in which earlier layers learn the overall
structure of the image and the latter ones refine the details. To propagate the
coarse information well, recent works usually build their generators by
stacking up multiple residual blocks. Although the residual block can produce a
high-quality image as well as be trained stably, it often impedes the
information flow in the network. To alleviate this problem, this brief
introduces a novel generator architecture that produces the image by combining
features obtained through two different branches: the main and auxiliary
branches. The goal of the main branch is to produce the image by passing
through the multiple residual blocks, whereas the auxiliary branch is to convey
the coarse information in the earlier layer to the later one. To combine the
features in the main and auxiliary branches successfully, we also propose a
gated feature fusion module that controls the information flow in those
branches. To prove the superiority of the proposed method, this brief provides
extensive experiments using various standard datasets including CIFAR-10,
CIFAR-100, LSUN, CelebA-HQ, AFHQ, and tiny-ImageNet. Furthermore, we conducted
various ablation studies to demonstrate the generalization ability of the
proposed method. Quantitative evaluations prove that the proposed method
exhibits impressive GAN performance in terms of Inception score (IS) and
Frechet inception distance (FID). For instance, the proposed method boosts the
FID and IS scores on the tiny-ImageNet dataset from 35.13 to 25.00 and 20.23 to
25.57, respectively.
- Abstract(参考訳): 生成逆数ネットワーク(GAN)のジェネレータは、前の層が画像の全体構造を学習し、後者が詳細を洗練する粗大な方法で画像生成を学習する。
粗い情報をよく広めるために、最近の研究は通常、複数の残余ブロックを積み重ねて生成器を構築する。
残差ブロックは高品質な画像を生成することができ、安定して訓練することができるが、しばしばネットワーク内の情報の流れを阻害する。
この問題を軽減するために,本論文では,主枝と補助枝の2つの異なる枝から得られた特徴を組み合わせることで,画像を生成する新しいジェネレータアーキテクチャを提案する。
メインブランチの目標は、複数の残差ブロックを通過して画像を生成することであり、補助ブランチは、前層の粗い情報を後層に伝達することである。
また,主枝と補助枝の特徴をうまく組み合わせるために,これらの枝内の情報の流れを制御するゲート機能融合モジュールを提案する。
提案手法の優位性を証明するため,CIFAR-10, CIFAR-100, LSUN, CelebA-HQ, AFHQ, little-ImageNetなど,様々な標準データセットを用いた広範な実験を行った。
さらに,提案手法の一般化能力を示すため,様々なアブレーション研究を行った。
定量的評価により,提案手法はインセプションスコア(IS)とFrechetインセプション距離(FID)の点で印象的なGAN性能を示すことが示された。
例えば、提案手法は、小さなImageNetデータセットのFIDとISスコアをそれぞれ35.13から25.00、20.23から25.57に引き上げる。
関連論文リスト
- WTDUN: Wavelet Tree-Structured Sampling and Deep Unfolding Network for Image Compressed Sensing [51.94493817128006]
マルチスケールウェーブレットサブバンド上で直接動作するWTDUNという新しいウェーブレットドメインの深層展開フレームワークを提案する。
本手法は,ウェーブレット係数の固有間隔とマルチスケール構造を利用して,木構造によるサンプリングと再構成を実現する。
論文 参考訳(メタデータ) (2024-11-25T12:31:03Z) - D$^3$: Scaling Up Deepfake Detection by Learning from Discrepancy [11.239248133240126]
我々は、より一般化と堅牢性のある普遍的なディープフェイク検出システムに向けた一歩を踏み出した。
本稿では,複数のジェネレータから汎用的なアーティファクトを学習することを目的として,Drepancy Deepfake Detectorフレームワークを提案する。
本フレームワークは,ID性能を維持しながら,現在のSOTA法と比較してOOD検査の精度を5.3%向上させる。
論文 参考訳(メタデータ) (2024-04-06T10:45:02Z) - Leveraging Representations from Intermediate Encoder-blocks for Synthetic Image Detection [13.840950434728533]
SID(State-of-the-art Synthetic Image Detection)研究は、基礎モデルからの特徴抽出の利点を強く証明している。
軽量ネットワークを介してCLIPの画像エンコーダの中間トランスフォーマーブロックから抽出した画像表現を利用する。
本手法は,20個のテストデータセットで評価し,平均+10.6%の絶対性能向上を示すことにより,最先端の手法と比較した。
論文 参考訳(メタデータ) (2024-02-29T12:18:43Z) - Exploring Incompatible Knowledge Transfer in Few-shot Image Generation [107.81232567861117]
少ないショット画像生成は、いくつかの参照サンプルを使用して、ターゲットドメインから多彩で高忠実な画像を生成することを学習する。
既存のF SIGメソッドは、ソースジェネレータから事前の知識を選択し、保存し、転送し、ターゲットジェネレータを学習する。
本稿では,知識保存を補完する操作であり,軽量プルーニング方式で実装した知識トランケーションを提案する。
論文 参考訳(メタデータ) (2023-04-15T14:57:15Z) - Latent Multi-Relation Reasoning for GAN-Prior based Image
Super-Resolution [61.65012981435095]
LARENはグラフベースの非絡み合いであり、階層的マルチリレーショナル推論によってより優れた非絡み合い空間を構築する。
我々は、LARENが優れた大因子画像SRを実現し、複数のベンチマークで常に最先端の性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-08-04T19:45:21Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Effective Shortcut Technique for GAN [6.007303976935779]
GAN(Generative Adversarial Network)ベースの画像生成技術は、複数の残留ブロックを積み重ねてジェネレータを設計する。
残余ブロックは一般に、ネットワーク内の情報伝達を効果的にサポートするショートカット、ieスキップ接続を含んでいる。
本稿では, ゲートショートカットと呼ばれる新しいショートカット手法を提案する。
論文 参考訳(メタデータ) (2022-01-27T07:14:45Z) - Generative Convolution Layer for Image Generation [8.680676599607125]
本稿では生成的畳み込み(GConv)と呼ばれる新しい畳み込み法を紹介する。
GConvはまず与えられた潜在ベクトルと互換性のある有用なカーネルを選択し、次に選択されたカーネルを線形に組み合わせて潜在固有カーネルを作成する。
提案手法は,潜時固有のカーネルを用いて,高品質な画像の生成を促す潜時特有の特徴を生成する。
論文 参考訳(メタデータ) (2021-11-30T07:14:12Z) - Single Image Dehazing with An Independent Detail-Recovery Network [117.86146907611054]
個別のDetail Recovery Network (DRN) を用いた単一画像デハージング手法を提案する。
DRNは、それぞれのローカルブランチとグローバルブランチを通じて、デハズドイメージの詳細を復元することを目的としている。
本手法は, 定量的, 定性的に, 最先端の脱ハージング法より優れる。
論文 参考訳(メタデータ) (2021-09-22T02:49:43Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Remote sensing image fusion based on Bayesian GAN [9.852262451235472]
PANとMSの画像を入力として使用する2ストリームジェネレータネットワークを構築し,特徴抽出,特徴融合,画像再構成という3つの部分から構成される。
我々はマルコフ判別器を活用し、融合画像の再構成能力を高めることにより、結果画像がより詳細な情報を保持することができる。
QuickBirdとWorldViewのデータセット実験により,本論文で提案したモデルがPANとMSの画像を効果的に融合できることが示されている。
論文 参考訳(メタデータ) (2020-09-20T16:15:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。