論文の概要: Generator From Edges: Reconstruction of Facial Images
- arxiv url: http://arxiv.org/abs/2002.06682v3
- Date: Thu, 14 May 2020 04:44:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-31 18:26:29.714556
- Title: Generator From Edges: Reconstruction of Facial Images
- Title(参考訳): エッジからのジェネレータ:顔画像の再構成
- Authors: Nao Takano and Gita Alaghband
- Abstract要約: ダニーエッジとペア画像を作成するために,GFE(Generator From Edges)を提案する。
我々の目標は、知覚的損失のレビューとともに、GFEの最良のアーキテクチャを決定することです。
GFEを中間処理として用いることで、筆跡からの顔画像の再構成が容易になる。
- 参考スコア(独自算出の注目度): 0.5156484100374059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applications that involve supervised training require paired images.
Researchers of single image super-resolution (SISR) create such images by
artificially generating blurry input images from the corresponding ground
truth. Similarly we can create paired images with the canny edge. We propose
Generator From Edges (GFE) [Figure 2]. Our aim is to determine the best
architecture for GFE, along with reviews of perceptual loss [1, 2]. To this
end, we conducted three experiments. First, we explored the effects of the
adversarial loss often used in SISR. In particular, we uncovered that it is not
an essential component to form a perceptual loss. Eliminating adversarial loss
will lead to a more effective architecture from the perspective of hardware
resource. It also means that considerations for the problems pertaining to
generative adversarial network (GAN) [3], such as mode collapse, are not
necessary. Second, we reexamined VGG loss and found that the mid-layers yield
the best results. By extracting the full potential of VGG loss, the overall
performance of perceptual loss improves significantly. Third, based on the
findings of the first two experiments, we reevaluated the dense network to
construct GFE. Using GFE as an intermediate process, reconstructing a facial
image from a pencil sketch can become an easy task.
- Abstract(参考訳): 教師付きトレーニングを含むアプリケーションは、ペアイメージを必要とする。
単一画像超解像(SISR)の研究者は、対応する基底真理からぼやけた入力画像を人工的に生成することで、そのような画像を作成する。
同様に、canny edgeでペアイメージを作成できる。
エッジからのジェネレータ(GFE) [図2]を提案する。
我々の目標は、知覚的損失[1, 2]のレビューとともに、GFEの最高のアーキテクチャを決定することです。
そこで我々は3つの実験を行った。
まず, SISRでよく使用される対向損失の影響について検討した。
特に、知覚的損失を形成するのに不可欠な要素ではないことが判明した。
敵の損失を排除することは、ハードウェアリソースの観点からより効果的なアーキテクチャをもたらす。
また、モード崩壊などの生成的逆ネットワーク(gan)[3]に関する問題に対する考慮は不要である。
第2に,VGG損失を再検討し,中間層が最もよい結果を得た。
VGG損失の全電位を抽出することにより、知覚的損失の全体的な性能が著しく向上する。
第3に、最初の2つの実験の結果に基づいて、GFEを構築するために高密度ネットワークを再評価した。
GFEを中間処理として用いることで、筆跡からの顔画像の再構成が容易になる。
関連論文リスト
- Untrained Perceptual Loss for image denoising of line-like structures in MR images [2.867517731896504]
本稿では,2次元データに対して行ったような損失関数における未学習ネットワークの特徴マップを比較して,知覚損失を3次元データに変換する。
脳血管画像(MR Angiograms - MRA)と土壌中の植物根画像のMR画像の3次元画像化において,uPL(untrained Perceptual Loss)の性能について検討した。
論文 参考訳(メタデータ) (2024-11-08T10:05:14Z) - GAN2X: Non-Lambertian Inverse Rendering of Image GANs [85.76426471872855]
GAN2Xは、教師なし画像のみをトレーニングに使用する、教師なし逆レンダリングの新しい手法である。
3次元形状を主眼とする従来のShape-from-GANアプローチとは異なり、GANが生成した擬似ペアデータを利用して、非ランベルト材料特性を復元する試みは初めてである。
実験により, GAN2Xは2次元画像を3次元形状, アルベド, 特異な特性に正確に分解し, 教師なしの単視3次元顔再構成の最先端性能を実現することができた。
論文 参考訳(メタデータ) (2022-06-18T16:58:49Z) - LTT-GAN: Looking Through Turbulence by Inverting GANs [86.25869403782957]
本稿では,よく訓練されたGANによってカプセル化された視覚的事前情報を利用した最初の乱流緩和手法を提案する。
視覚的先行性に基づき、周期的な文脈距離で復元された画像の同一性を維持することを学ぶことを提案する。
本手法は, 回復した結果の視覚的品質と顔認証精度の両方において, 先行技術よりも優れていた。
論文 参考訳(メタデータ) (2021-12-04T16:42:13Z) - Contrastive Feature Loss for Image Prediction [55.373404869092866]
教師付き画像合成モデルのトレーニングでは、批評家は2つの画像を比較する必要がある。
本稿では,2つの画像間の類似度を測定するための情報理論に基づくアプローチを提案する。
この定式化により,L1損失の代替として,出力画像の知覚的リアリズムが向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T20:39:52Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Pixel-wise Dense Detector for Image Inpainting [34.721991959357425]
近年のGANベースの画像インパインティング手法では,画像の識別とスカラー出力に平均的手法が採用されている。
本稿では, 画像インパインティングのための新たな検出ベース生成フレームワークを提案し, 逆方向のプロセスにおいてmin-max戦略を採用する。
複数の公開データセットの実験は、提案したフレームワークの優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2020-11-04T13:45:27Z) - A Self-supervised GAN for Unsupervised Few-shot Object Recognition [39.79912546252623]
本稿では、教師なし数発の物体認識について述べる。
すべてのトレーニングイメージはラベル付けされておらず、テストイメージはクエリと、対象のクラス毎にラベル付きサポートイメージに分割されている。
我々は,バニラGANを2つの損失関数で拡張し,それぞれが自己教師型学習を目的とした。
論文 参考訳(メタデータ) (2020-08-16T19:47:26Z) - DDR-ID: Dual Deep Reconstruction Networks Based Image Decomposition for
Anomaly Detection [2.4589632879498478]
画像異常検出(AD)における重要な課題の1つは、通常のクラストレーニングからのみ識別情報を学習することである。
本稿では,DDR-ID(Double Deep Restructed Network based Image decomposition)と呼ばれるAD手法を提案する。
2つの異常スコアを算出し、通常のクラス潜在空間または再構成画像空間における画像の異常度を定量化する。
論文 参考訳(メタデータ) (2020-07-18T13:54:59Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z) - Structure-Preserving Super Resolution with Gradient Guidance [87.79271975960764]
単一画像超解像(SISR)の構造
最近のGAN(Generative Adversarial Network)による研究は、SISRの開発を促進している。
しかし、復元された画像には常に望ましくない構造歪みがある。
論文 参考訳(メタデータ) (2020-03-29T17:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。