論文の概要: R-MNet: A Perceptual Adversarial Network for Image Inpainting
- arxiv url: http://arxiv.org/abs/2008.04621v3
- Date: Mon, 9 Nov 2020 17:08:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 11:44:26.853848
- Title: R-MNet: A Perceptual Adversarial Network for Image Inpainting
- Title(参考訳): R-MNet:イメージペイントのための知覚的敵対ネットワーク
- Authors: Jireh Jam and Connah Kendrick and Vincent Drouard and Kevin Walker and
Gee-Sern Hsu and Moi Hoon Yap
- Abstract要約: 本稿では,新たな逆マスク演算子であるReverse Masking Network(R-MNet)と組み合わせたWasserstein GANを提案する。
提案手法は,高分解能な塗装作業に一般化でき,人間の視覚系に適応可能なよりリアルな出力を示す。
- 参考スコア(独自算出の注目度): 5.471225956329675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial image inpainting is a problem that is widely studied, and in recent
years the introduction of Generative Adversarial Networks, has led to
improvements in the field. Unfortunately some issues persists, in particular
when blending the missing pixels with the visible ones. We address the problem
by proposing a Wasserstein GAN combined with a new reverse mask operator,
namely Reverse Masking Network (R-MNet), a perceptual adversarial network for
image inpainting. The reverse mask operator transfers the reverse masked image
to the end of the encoder-decoder network leaving only valid pixels to be
inpainted. Additionally, we propose a new loss function computed in feature
space to target only valid pixels combined with adversarial training. These
then capture data distributions and generate images similar to those in the
training data with achieved realism (realistic and coherent) on the output
images. We evaluate our method on publicly available dataset, and compare with
state-of-the-art methods. We show that our method is able to generalize to
high-resolution inpainting task, and further show more realistic outputs that
are plausible to the human visual system when compared with the
state-of-the-art methods.
- Abstract(参考訳): 顔画像のインパインティングは広く研究されている問題であり、近年は生成的広告ネットワークの導入によってこの分野が改善されている。
残念なことに、特に欠けているピクセルと見えるピクセルをブレンドする場合、いくつかの問題は継続する。
本稿では,Warsserstein GANとReverse Masking Network(Reverse Masking Network, R-MNet)を組み合わせた画像インペイントの対角線ネットワークを提案する。
逆マスクオペレータは、逆マスク画像をエンコーダ−デコーダネットワークの終端に転送し、有効画素のみを塗り込む。
さらに,有効な画素のみを対象とする特徴空間で計算した新たな損失関数と,逆訓練を提案する。
これにより、データ分布をキャプチャし、出力画像上で達成されたリアリズム(現実的かつコヒーレント)を備えたトレーニングデータに類似した画像を生成する。
本手法を公開データセット上で評価し,最新手法との比較を行った。
本手法は,高精細化タスクに一般化できると同時に,最先端の手法と比較して,人間の視覚システムに対してより現実的なアウトプットを提示できることを示す。
関連論文リスト
- T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - What's Behind the Mask: Estimating Uncertainty in Image-to-Image
Problems [29.55144604924458]
画像間ネットワークの不確実性を推定することは重要な課題である。
マスキングに基づく新しい手法を提案する。
マスクを用いた画像カラー化,画像補完,超解像処理における不確実性の評価を行った。
論文 参考訳(メタデータ) (2022-11-28T10:41:34Z) - Contextual Attention Mechanism, SRGAN Based Inpainting System for
Eliminating Interruptions from Images [2.894944733573589]
完全な機械学習アプローチを用いて,画像のインペイントのためのエンドツーエンドパイプラインを提案する。
まず、YOLOモデルを使用して、画像から削除したいオブジェクトを自動的に識別し、ローカライズします。
その後、領域を埋めるためにコンテキストアテンション法を用いたGANモデルにマスク画像とオリジナル画像を提供する。
論文 参考訳(メタデータ) (2022-04-06T05:51:04Z) - A Wasserstein GAN for Joint Learning of Inpainting and its Spatial
Optimisation [3.4392739159262145]
空間的インペイントデータ最適化のための最初の生成逆ネットワークを提案する。
従来のアプローチとは対照的に、着色発電機とそれに対応するマスクネットワークのジョイントトレーニングが可能である。
これにより、従来のモデルよりも視覚的品質とスピードが大幅に向上し、現在の最適化ネットワークよりも優れています。
論文 参考訳(メタデータ) (2022-02-11T14:02:36Z) - RePaint: Inpainting using Denoising Diffusion Probabilistic Models [161.74792336127345]
Free-form Inpaintingは任意のバイナリマスクで指定された領域のイメージに新しいコンテンツを追加するタスクである。
RePaint: A Denoising Probabilistic Model (DDPM) を用いた塗装手法を提案する。
本手法は,標準的なマスクと極端マスクを用いて,顔と汎用画像の塗装の両面で検証する。
論文 参考訳(メタデータ) (2022-01-24T18:40:15Z) - Inverse Problems Leveraging Pre-trained Contrastive Representations [88.70821497369785]
破損したデータの表現を復元するための新しい逆問題群について検討する。
コントラスト目的を用いた教師付きインバージョン手法を提案する。
提案手法は,幅広いフォワード演算子においてラベル付きデータのごく一部であっても,エンド・ツー・エンドのベースラインよりも優れる。
論文 参考訳(メタデータ) (2021-10-14T15:06:30Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - High-Resolution Image Inpainting with Iterative Confidence Feedback and
Guided Upsampling [122.06593036862611]
既存の画像塗装法は、実アプリケーションで大きな穴を扱う際に、しばしばアーティファクトを生成する。
本稿では,フィードバック機構を備えた反復インペイント手法を提案する。
実験により,本手法は定量評価と定性評価の両方において既存手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-05-24T13:23:45Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Symmetric Skip Connection Wasserstein GAN for High-Resolution Facial
Image Inpainting [5.163405308079487]
本稿では,S-WGAN(Symmetric Skip Connection Wasserstein Generative Adversarial Network)を提案する。
アーキテクチャは畳み込みブロックを持つエンコーダデコーダで、スキップ接続によってリンクされる。
CelebA-HQデータセット上で,本手法と最先端手法の評価を行った。
論文 参考訳(メタデータ) (2020-01-11T09:09:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。