論文の概要: Image Generation Via Minimizing Fr\'echet Distance in Discriminator
Feature Space
- arxiv url: http://arxiv.org/abs/2003.11774v2
- Date: Mon, 30 Mar 2020 20:35:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 21:31:15.461289
- Title: Image Generation Via Minimizing Fr\'echet Distance in Discriminator
Feature Space
- Title(参考訳): 判別器特徴空間におけるfr\'echet距離最小化による画像生成
- Authors: Khoa D. Doan and Saurav Manchanda and Fengjiao Wang and Sathiya
Keerthi and Avradeep Bhowmik and Chandan K. Reddy
- Abstract要約: Fr'echet-GAN と OT-GAN は,既存の代表的原始的および双対的GAN アプローチよりも画像生成能力に優れていた。
我々はFr'echet距離とその勾配を計算するための効率的で数値的に安定な手法を提案する。
さらに,Fr'echet-GAN と OT-GAN は,既存の代表的なプリミティブおよびデュアルGAN アプローチに比べて,画像生成能力が大幅に向上していることを示す。
- 参考スコア(独自算出の注目度): 10.569405119282667
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a given image generation problem, the intrinsic image manifold is often
low dimensional. We use the intuition that it is much better to train the GAN
generator by minimizing the distributional distance between real and generated
images in a small dimensional feature space representing such a manifold than
on the original pixel-space. We use the feature space of the GAN discriminator
for such a representation. For distributional distance, we employ one of two
choices: the Fr\'{e}chet distance or direct optimal transport (OT); these
respectively lead us to two new GAN methods: Fr\'{e}chet-GAN and OT-GAN. The
idea of employing Fr\'{e}chet distance comes from the success of Fr\'{e}chet
Inception Distance as a solid evaluation metric in image generation.
Fr\'{e}chet-GAN is attractive in several ways. We propose an efficient,
numerically stable approach to calculate the Fr\'{e}chet distance and its
gradient. The Fr\'{e}chet distance estimation requires a significantly less
computation time than OT; this allows Fr\'{e}chet-GAN to use much larger
mini-batch size in training than OT. More importantly, we conduct experiments
on a number of benchmark datasets and show that Fr\'{e}chet-GAN (in particular)
and OT-GAN have significantly better image generation capabilities than the
existing representative primal and dual GAN approaches based on the Wasserstein
distance.
- Abstract(参考訳): 与えられた画像生成問題に対して、固有画像多様体はしばしば低次元である。
このような多様体を表す小さな次元特徴空間における実画像と生成画像の分布距離を元のピクセル空間よりも最小にすることで、GAN生成装置を訓練する方がずっとよいという直感を使う。
このような表現には、GAN識別器の特徴空間を用いる。
分布距離については、fr\'{e}chet distance と direct optimal transport (ot) の2つの選択肢のうちの1つを採用し、これらはそれぞれ2つの新しいgan法(fr\'{e}chet-gan と ot-gan)に導かれる。
Fr\'{e}chet 距離を利用するというアイデアは、画像生成における確固とした評価指標としての Fr\'{e}chet Inception Distance の成功に由来する。
Fr\'{e}chet-GAN はいくつかの点で魅力的である。
Fr\'{e}chet 距離とその勾配を計算するための効率的で数値的に安定な手法を提案する。
Fr\'{e}chet 距離推定は OT よりも計算時間が非常に少なく、これにより Fr\'{e}chet-GAN は OT よりもはるかに大きなミニバッチサイズを使用することができる。
さらに,Fr\'{e}chet-GAN(特に)とOT-GANは,ワッサーシュタイン距離に基づく既存の代表的原始的および双対的GANアプローチよりも有意に優れた画像生成能力を有することを示す。
関連論文リスト
- Deep Generative Sampling in the Dual Divergence Space: A Data-efficient & Interpretative Approach for Generative AI [29.13807697733638]
自然画像の生成的サンプリングにおける顕著な成果の上に構築する。
我々は、画像に似たサンプルを生成するという、画期的な挑戦を、潜在的に過度に野心的に提案する。
統計上の課題は、小さなサンプルサイズであり、時には数百人の被験者で構成されている。
論文 参考訳(メタデータ) (2024-04-10T22:35:06Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - Latent Space is Feature Space: Regularization Term for GANs Training on
Limited Dataset [1.8634083978855898]
LFMと呼ばれるGANの付加的な構造と損失関数を提案し、潜在空間の異なる次元間の特徴の多様性を最大化するよう訓練した。
実験では、このシステムはDCGAN上に構築されており、CelebAデータセットのスクラッチからFrechet Inception Distance(FID)トレーニングを改善することが証明されている。
論文 参考訳(メタデータ) (2022-10-28T16:34:48Z) - Memory-augmented Deep Unfolding Network for Guided Image
Super-resolution [67.83489239124557]
誘導画像超解像(GISR)は、HR画像の誘導の下で低解像度(LR)目標画像の空間分解能を高めて高解像度(HR)目標画像を得る。
従来のモデルベース手法は主に画像全体を取り、HR目標画像とHRガイダンス画像との事前分布を仮定する。
HR目標画像上で2種類の事前性を持つGISRの最大後部(MAP)推定モデルを提案する。
論文 参考訳(メタデータ) (2022-02-12T15:37:13Z) - Latent reweighting, an almost free improvement for GANs [12.605607949417033]
一連の作業は、計算コストの増大を犠牲にして、事前訓練された発電機からのサンプリング品質を改善することを目的としている。
遅延重みを予測するための追加ネットワークと、最も貧しいサンプルを避けるための2つの関連するサンプリング手法を導入する。
論文 参考訳(メタデータ) (2021-10-19T08:33:57Z) - Generative Modeling with Optimal Transport Maps [83.59805931374197]
OT(Optimal Transport)は、大規模な生成モデリングタスクのための強力なツールとなっている。
OTマップ自体が生成モデルとして利用でき、同等の性能が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T18:17:02Z) - Low-Rank Subspaces in GANs [101.48350547067628]
この研究は、GAN生成をより正確に制御できる低ランクな部分空間を導入している。
LowRankGAN は属性多様体の低次元表現を見つけることができる。
さまざまなデータセットでトレーニングされた最先端のGANモデル(StyleGAN2やBigGANなど)の実験は、私たちのLowRankGANの有効性を示しています。
論文 参考訳(メタデータ) (2021-06-08T16:16:32Z) - Fast Distance-based Anomaly Detection in Images Using an Inception-like
Autoencoder [16.157879279661362]
畳み込みオートエンコーダ(CAE)を訓練し、画像の低次元表現を抽出する。
画像の学習表現の低次元空間に距離ベースの異常検出器を用いる。
その結果,予測性能が向上した。
論文 参考訳(メタデータ) (2020-03-12T16:10:53Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Optimizing Generative Adversarial Networks for Image Super Resolution
via Latent Space Regularization [4.529132742139768]
GAN(Generative Adversarial Networks)は、多様体内の実画像の分布を学習し、実際のように見えるサンプルを生成する。
本稿では,これらの問題を教師付きGANに対して緩和する方法を探究する。
論文 参考訳(メタデータ) (2020-01-22T16:27:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。