論文の概要: Effective Shortcut Technique for GAN
- arxiv url: http://arxiv.org/abs/2201.11351v1
- Date: Thu, 27 Jan 2022 07:14:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 13:35:05.523535
- Title: Effective Shortcut Technique for GAN
- Title(参考訳): GANの効率的なショートカット技術
- Authors: Seung Park, Cheol-Hwan Yoo, Yong-Goo Shin
- Abstract要約: GAN(Generative Adversarial Network)ベースの画像生成技術は、複数の残留ブロックを積み重ねてジェネレータを設計する。
残余ブロックは一般に、ネットワーク内の情報伝達を効果的にサポートするショートカット、ieスキップ接続を含んでいる。
本稿では, ゲートショートカットと呼ばれる新しいショートカット手法を提案する。
- 参考スコア(独自算出の注目度): 6.007303976935779
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, generative adversarial network (GAN)-based image generation
techniques design their generators by stacking up multiple residual blocks. The
residual block generally contains a shortcut, \ie skip connection, which
effectively supports information propagation in the network. In this paper, we
propose a novel shortcut method, called the gated shortcut, which not only
embraces the strength point of the residual block but also further boosts the
GAN performance. More specifically, based on the gating mechanism, the proposed
method leads the residual block to keep (or remove) information that is
relevant (or irrelevant) to the image being generated. To demonstrate that the
proposed method brings significant improvements in the GAN performance, this
paper provides extensive experimental results on the various standard datasets
such as CIFAR-10, CIFAR-100, LSUN, and tiny-ImageNet. Quantitative evaluations
show that the gated shortcut achieves the impressive GAN performance in terms
of Frechet inception distance (FID) and Inception score (IS). For instance, the
proposed method improves the FID and IS scores on the tiny-ImageNet dataset
from 35.13 to 27.90 and 20.23 to 23.42, respectively.
- Abstract(参考訳): 近年,GAN(Generative Adversarial Network)に基づく画像生成技術は,複数の残差ブロックを積み重ねて生成体を設計している。
残余ブロックは一般に、ネットワーク内の情報伝達を効果的にサポートするショートカット \ie スキップ接続を含む。
本稿では,残差ブロックの強度点を包含するだけでなく,gan性能をさらに向上させるゲートショートカットと呼ばれる新しいショートカット手法を提案する。
より具体的には、ゲーティング機構に基づいて、提案手法は、生成される画像に関連(または関連しない)情報を保持する(または削除する)ために残差ブロックを導く。
提案手法は,CIFAR-10, CIFAR-100, LSUN, little-ImageNetなどの各種標準データセットに対して, GAN性能の大幅な改善をもたらすことを示す。
また,Frechet Inception distance (FID) およびInception score (IS) を用いて,ゲートショートカットにより印象的なGAN性能が得られることを示した。
例えば、提案手法は、小画像NetデータセットのFIDとISスコアを35.13から27.90、20.23から23.42に改善する。
関連論文リスト
- Efficient GANs for Document Image Binarization Based on DWT and Normalization [7.597556504891501]
GAN(Generative Adversarial Network)は、影やノイズを効果的に除去した画像を生成し、テキスト情報の抽出を可能にする。
本研究では、離散ウェーブレット変換と正規化を組み込んだ3段階ネットワークアーキテクチャに基づく効率的なGAN手法を提案する。
実験の結果,提案手法はSOTA法と比較してトレーニング時間を10%削減し,推論時間を26%短縮することがわかった。
論文 参考訳(メタデータ) (2024-07-05T03:19:32Z) - Weakly Supervised LiDAR Semantic Segmentation via Scatter Image Annotation [38.715754110667916]
画像アノテーションを用いたLiDARセマンティックセマンティックセマンティックセマンティクスを実装した。
また、パフォーマンスギャップを減らすための3つの重要な戦略を含むネットワークであるScatterNetを提案する。
本手法は,完全教師付き手法の95%以上の性能を達成するために,ラベル付き点の0.02%未満を必要とする。
論文 参考訳(メタデータ) (2024-04-19T13:01:30Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Manifold Constraint Regularization for Remote Sensing Image Generation [34.68714863219855]
GAN(Generative Adversarial Networks)は、リモートセンシング領域における顕著な成果を示している。
本稿では,リモートセンシング画像の特徴を分析し,多様体制約正規化を提案する。
論文 参考訳(メタデータ) (2023-05-31T02:35:41Z) - RDRN: Recursively Defined Residual Network for Image Super-Resolution [58.64907136562178]
深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像において顕著な性能を得た。
本稿では,注目ブロックを効率的に活用する新しいネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-17T11:06:29Z) - A Novel Generator with Auxiliary Branch for Improving GAN Performance [7.005458308454871]
本稿では、2つの異なるブランチから得られた特徴を組み合わせることで、画像を生成する新しいジェネレータアーキテクチャを紹介する。
メインブランチの目標は、複数の残留ブロックを通り抜けて画像を生成することであり、補助ブランチは、前のレイヤの粗い情報を後層に伝達することである。
提案手法の優位性を証明するため, 各種標準データセットを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2021-12-30T08:38:49Z) - Semantic Segmentation by Improved Generative Adversarial Networks [0.0]
画像セマンティックセグメンテーションタスクの効果的な改善ソリューションとして、Convolutional CRF(ConvCRF)を紹介します。
提案手法は,入力画像から対応する出力画像へのエンドツーエンドマッピングを学習するだけでなく,このマッピングをトレーニングするための損失関数も学習する。
論文 参考訳(メタデータ) (2021-04-20T11:59:29Z) - Manifold Regularized Dynamic Network Pruning [102.24146031250034]
本稿では,全インスタンスの多様体情報をプルーンドネットワークの空間に埋め込むことにより,冗長フィルタを動的に除去する新しいパラダイムを提案する。
提案手法の有効性をいくつかのベンチマークで検証し,精度と計算コストの両面で優れた性能を示す。
論文 参考訳(メタデータ) (2021-03-10T03:59:03Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。