論文の概要: Compound Frechet Inception Distance for Quality Assessment of GAN
Created Images
- arxiv url: http://arxiv.org/abs/2106.08575v1
- Date: Wed, 16 Jun 2021 06:53:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-17 17:24:18.941255
- Title: Compound Frechet Inception Distance for Quality Assessment of GAN
Created Images
- Title(参考訳): GAN生成画像の品質評価のための複合フレチェット開始距離
- Authors: Eric J. Nunn, Pejman Khadivi, Shadrokh Samavi
- Abstract要約: GANの注目すべき応用の1つは、ディープフェイク(deep fakes)として知られる偽の人間の顔を開発することである。
生成された画像の品質を測定することは本質的に主観的だが、標準化されたメトリクスを使って品質を客観化しようとする試みがなされている。
我々は,より広い視覚的欠陥をカバーするために,低レベルの特徴を統合することにより,評価プロセスの堅牢性を向上させることを提案する。
- 参考スコア(独自算出の注目度): 7.628527132779575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks or GANs are a type of generative modeling
framework. GANs involve a pair of neural networks engaged in a competition in
iteratively creating fake data, indistinguishable from the real data. One
notable application of GANs is developing fake human faces, also known as "deep
fakes," due to the deep learning algorithms at the core of the GAN framework.
Measuring the quality of the generated images is inherently subjective but
attempts to objectify quality using standardized metrics have been made. One
example of objective metrics is the Frechet Inception Distance (FID), which
measures the difference between distributions of feature vectors for two
separate datasets of images. There are situations that images with low
perceptual qualities are not assigned appropriate FID scores. We propose to
improve the robustness of the evaluation process by integrating lower-level
features to cover a wider array of visual defects. Our proposed method
integrates three levels of feature abstractions to evaluate the quality of
generated images. Experimental evaluations show better performance of the
proposed method for distorted images.
- Abstract(参考訳): generative adversarial networks(gans)は、生成モデリングフレームワークの一種である。
GANには、実際のデータと区別できない偽のデータを反復的に生成する競合に関わる2つのニューラルネットワークが含まれる。
gansの注目すべき応用のひとつは、ganフレームワークのコアにあるディープラーニングアルゴリズムのために、"deep fakes"としても知られる偽の人間の顔を開発することだ。
生成した画像の品質を測定することは本質的に主観的であるが、標準化されたメトリクスを使って品質を客観化しようとする試みがなされている。
客観的指標の1つの例はフレシェインセプション距離(frechet inception distance, fid)であり、画像の2つの別々のデータセットに対する特徴ベクトルの分布の差を測定する。
知覚品質の低い画像には適切なFIDスコアが割り当てられていない状況がある。
評価プロセスのロバスト性を向上させるために,より広い視覚欠陥に対応する低レベルの機能を統合することを提案する。
提案手法は,生成画像の品質評価のために3段階の機能抽象化を統合する。
実験により,歪み画像に対する提案手法の性能が向上した。
関連論文リスト
- Attention Down-Sampling Transformer, Relative Ranking and Self-Consistency for Blind Image Quality Assessment [17.04649536069553]
非参照画像品質評価は、元の参照なしで画像品質を推定する難しい領域である。
変換器エンコーダとCNNを用いて,画像から局所的および非局所的情報を抽出する機構を改良した。
非参照画像品質評価(NR-IQA)モデルの劣化に対処し,自己超越に対する自己整合性アプローチを提案する。
論文 参考訳(メタデータ) (2024-09-11T09:08:43Z) - DeepFidelity: Perceptual Forgery Fidelity Assessment for Deepfake
Detection [67.3143177137102]
ディープフェイク検出(Deepfake detection)とは、画像やビデオにおいて、人工的に生成された顔や編集された顔を検出すること。
本稿では,実顔と偽顔とを適応的に識別するDeepFidelityという新しいDeepfake検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T07:19:45Z) - Rethinking FID: Towards a Better Evaluation Metric for Image Generation [43.66036053597747]
Inception Distanceは、実画像のInception-v3特徴分布とアルゴリズムによって生成された画像の距離を推定する。
インセプションの貧弱な表現は、現代のテキスト・画像モデルによって生成されるリッチで多様なコンテンツ、不正確な正規性仮定、そしてサンプルの複雑さによって引き起こされる。
よりリッチなCLIP埋め込みとガウスRBFカーネルとの最大平均差距離に基づく代替のCMMDを提案する。
論文 参考訳(メタデータ) (2023-11-30T19:11:01Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - Parents and Children: Distinguishing Multimodal DeepFakes from Natural Images [60.34381768479834]
近年の拡散モデルの発展により、自然言語のテキストプロンプトから現実的なディープフェイクの生成が可能になった。
我々は、最先端拡散モデルにより生成されたディープフェイク検出に関する体系的研究を開拓した。
論文 参考訳(メタデータ) (2023-04-02T10:25:09Z) - Dehazed Image Quality Evaluation: From Partial Discrepancy to Blind
Perception [35.257798506356814]
画像のデハジングは、ぼんやりとした画像から空間的詳細を復元することを目的としている。
本稿では,部分的不一致に基づく画像品質評価手法を提案する。
Blind Perceptionを用いたNo-Reference品質評価尺度に拡張する。
論文 参考訳(メタデータ) (2022-11-22T23:49:14Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Deep Superpixel-based Network for Blind Image Quality Assessment [4.079861933099766]
ブラインド画像品質評価(BIQA)モデルの目標は、人間の目で画像を評価する過程をシミュレートすることである。
マルチスケールおよびスーパーピクセルセグメンテーションに基づいて画像の画質を評価するために, DSN-IQA という深層適応型スーパーピクセルベースネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-13T08:26:58Z) - Label Geometry Aware Discriminator for Conditional Generative Networks [40.89719383597279]
条件付きGenerative Adversarial Networks(GAN)は、目的のターゲットクラスで高画質の画像を生成することができます。
これらの合成画像は、画像分類などの下流監督タスクを改善するために必ずしも役に立たない。
論文 参考訳(メタデータ) (2021-05-12T08:17:25Z) - Towards Unsupervised Deep Image Enhancement with Generative Adversarial
Network [92.01145655155374]
監視されていない画像強調生成ネットワーク(UEGAN)を提案する。
教師なしの方法で所望の特性を持つ画像の集合から、対応する画像と画像のマッピングを学習する。
その結果,提案モデルは画像の美的品質を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:22:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。