論文の概要: Symmetric Skip Connection Wasserstein GAN for High-Resolution Facial
Image Inpainting
- arxiv url: http://arxiv.org/abs/2001.03725v2
- Date: Sat, 12 Sep 2020 21:16:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-12 09:44:11.792113
- Title: Symmetric Skip Connection Wasserstein GAN for High-Resolution Facial
Image Inpainting
- Title(参考訳): 高分解能顔画像塗布用対称スキップ接続ワッサースタインGAN
- Authors: Jireh Jam, Connah Kendrick, Vincent Drouard, Kevin Walker, Gee-Sern
Hsu, and Moi Hoon Yap
- Abstract要約: 本稿では,S-WGAN(Symmetric Skip Connection Wasserstein Generative Adversarial Network)を提案する。
アーキテクチャは畳み込みブロックを持つエンコーダデコーダで、スキップ接続によってリンクされる。
CelebA-HQデータセット上で,本手法と最先端手法の評価を行った。
- 参考スコア(独自算出の注目度): 5.163405308079487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The state-of-the-art facial image inpainting methods achieved promising
results but face realism preservation remains a challenge. This is due to
limitations such as; failures in preserving edges and blurry artefacts. To
overcome these limitations, we propose a Symmetric Skip Connection Wasserstein
Generative Adversarial Network (S-WGAN) for high-resolution facial image
inpainting. The architecture is an encoder-decoder with convolutional blocks,
linked by skip connections. The encoder is a feature extractor that captures
data abstractions of an input image to learn an end-to-end mapping from an
input (binary masked image) to the ground-truth. The decoder uses learned
abstractions to reconstruct the image. With skip connections, S-WGAN transfers
image details to the decoder. Additionally, we propose a Wasserstein-Perceptual
loss function to preserve colour and maintain realism on a reconstructed image.
We evaluate our method and the state-of-the-art methods on CelebA-HQ dataset.
Our results show S-WGAN produces sharper and more realistic images when
visually compared with other methods. The quantitative measures show our
proposed S-WGAN achieves the best Structure Similarity Index Measure (SSIM) of
0.94.
- Abstract(参考訳): 最先端の顔面画像インパインティング手法は有望な結果を得たが、フェイスリアリズムの保存は依然として課題である。
これは、エッジの保存に失敗することやぼやけたアーティファクトなど、制限によるものだ。
これらの制約を克服するために,高精細な顔画像の描画のためのS-WGAN(Symmetric Skip Connection Wasserstein Generative Adversarial Network)を提案する。
アーキテクチャは畳み込みブロックを持つエンコーダデコーダで、スキップ接続によってリンクされる。
エンコーダは、入力画像のデータ抽象化をキャプチャして、入力(バイナリマスク画像)からグランド真実へのエンドツーエンドマッピングを学ぶ機能抽出器である。
デコーダは学習した抽象化を使用してイメージを再構築する。
スキップ接続では、S-WGANは画像の詳細をデコーダに転送する。
さらに,色を保存し,再構成画像上でリアリズムを維持するワッサースタイン知覚損失関数を提案する。
CelebA-HQデータセット上で,本手法と最先端手法の評価を行った。
その結果,S-WGANは他の手法と比較して,シャープでリアルな画像が得られることがわかった。
提案するs-wganはssim (best structure similarity index measure) が0.94であることを示す。
関連論文リスト
- Panoramic Image Inpainting With Gated Convolution And Contextual
Reconstruction Loss [19.659176149635417]
フェースジェネレータ,キューブジェネレータ,サイドブランチ,および2つの識別器からなるパノラマ画像インペイントフレームワークを提案する。
提案手法は,PSNRおよびSSIMの観点から,SUN360ストリートビューデータセット上の最先端(SOTA)手法と比較する。
論文 参考訳(メタデータ) (2024-02-05T11:58:08Z) - ENTED: Enhanced Neural Texture Extraction and Distribution for
Reference-based Blind Face Restoration [51.205673783866146]
我々は,高品質でリアルな肖像画を復元することを目的とした,ブラインドフェイス修復のための新しいフレームワークであるENTEDを提案する。
劣化した入力画像と参照画像の間で高品質なテクスチャ特徴を伝達するために,テクスチャ抽出と分布の枠組みを利用する。
われわれのフレームワークにおけるStyleGANのようなアーキテクチャは、現実的な画像を生成するために高品質な潜伏符号を必要とする。
論文 参考訳(メタデータ) (2024-01-13T04:54:59Z) - SuperInpaint: Learning Detail-Enhanced Attentional Implicit
Representation for Super-resolutional Image Inpainting [26.309834304515544]
我々はSuperInpaintと呼ばれる課題の画像復元タスクを導入する。
この課題は、低解像度画像中の欠落領域を再構築し、任意の高解像度画像を生成することである。
本論文では,SuperInpaintを1つのモデルで実現可能な細部強調型暗黙表現を提案する。
論文 参考訳(メタデータ) (2023-07-26T20:28:58Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - SARGAN: Spatial Attention-based Residuals for Facial Expression
Manipulation [1.7056768055368383]
本稿では,3つの視点から制限に対処するSARGANという新しい手法を提案する。
我々は対称エンコーダ・デコーダネットワークを利用して顔の特徴に複数スケールで対応した。
提案手法は最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-03-30T08:15:18Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - R-MNet: A Perceptual Adversarial Network for Image Inpainting [5.471225956329675]
本稿では,新たな逆マスク演算子であるReverse Masking Network(R-MNet)と組み合わせたWasserstein GANを提案する。
提案手法は,高分解能な塗装作業に一般化でき,人間の視覚系に適応可能なよりリアルな出力を示す。
論文 参考訳(メタデータ) (2020-08-11T10:58:10Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z) - High-Resolution Image Inpainting with Iterative Confidence Feedback and
Guided Upsampling [122.06593036862611]
既存の画像塗装法は、実アプリケーションで大きな穴を扱う際に、しばしばアーティファクトを生成する。
本稿では,フィードバック機構を備えた反復インペイント手法を提案する。
実験により,本手法は定量評価と定性評価の両方において既存手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-05-24T13:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。