論文の概要: A Wasserstein GAN for Joint Learning of Inpainting and its Spatial
Optimisation
- arxiv url: http://arxiv.org/abs/2202.05623v1
- Date: Fri, 11 Feb 2022 14:02:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-14 15:20:03.898834
- Title: A Wasserstein GAN for Joint Learning of Inpainting and its Spatial
Optimisation
- Title(参考訳): 塗装の連成学習のためのWasserstein GANとその空間最適化
- Authors: Pascal Peter
- Abstract要約: 空間的インペイントデータ最適化のための最初の生成逆ネットワークを提案する。
従来のアプローチとは対照的に、着色発電機とそれに対応するマスクネットワークのジョイントトレーニングが可能である。
これにより、従来のモデルよりも視覚的品質とスピードが大幅に向上し、現在の最適化ネットワークよりも優れています。
- 参考スコア(独自算出の注目度): 3.4392739159262145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classic image inpainting is a restoration method that reconstructs missing
image parts. However, a carefully selected mask of known pixels that yield a
high quality inpainting can also act as a sparse image representation. This
challenging spatial optimisation problem is essential for practical
applications such as compression. So far, it has been almost exclusively
addressed by model-based approaches. First attempts with neural networks seem
promising, but are tailored towards specific inpainting operators or require
postprocessing. To address this issue, we propose the first generative
adversarial network for spatial inpainting data optimisation. In contrast to
previous approaches, it allows joint training of an inpainting generator and a
corresponding mask optimisation network. With a Wasserstein distance, we ensure
that our inpainting results accurately reflect the statistics of natural
images. This yields significant improvements in visual quality and speed over
conventional stochastic models and also outperforms current spatial
optimisation networks.
- Abstract(参考訳): 古典的画像塗装は、欠落した画像部品を復元する復元方法である。
しかし、高品質なインペイントが得られる既知の画素の慎重に選択されたマスクは、スパース画像表現としても機能する。
この難しい空間最適化問題は圧縮のような実用的な応用には不可欠である。
これまでのところ、ほとんどモデルベースのアプローチで対処されてきた。
ニューラルネットワークを使った最初の試みは有望に思えるが、特定のインペイント演算子や後処理を必要とする。
この問題に対処するために,空間インパインティングデータ最適化のための最初の生成型逆ネットワークを提案する。
従来のアプローチとは対照的に、着色発電機とそれに対応するマスク最適化ネットワークのジョイントトレーニングが可能である。
ワッセルシュタイン距離は、我々の塗装結果が自然画像の統計を正確に反映することを保証する。
これにより、従来の確率モデルよりも視覚的品質と速度が大幅に向上し、現在の空間最適化ネットワークよりも優れている。
関連論文リスト
- WavePaint: Resource-efficient Token-mixer for Self-supervised Inpainting [2.3014300466616078]
本稿では、計算効率の良いWaveMixベースの完全畳み込みアーキテクチャであるWavePaintを用いて、視覚変換器から分岐する。
2次元離散ウェーブレット変換(DWT)を用いて、畳み込み層とともに、空間的および多重解像度のトークン混合を行う。
我々のモデルは、CelebA-HQデータセットの現在のGANアーキテクチャよりも優れている。
論文 参考訳(メタデータ) (2023-07-01T18:41:34Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - High-Fidelity Image Inpainting with GAN Inversion [23.49170140410603]
本稿では,InvertFillと呼ばれる画像インペイントのための新しいGANインバージョンモデルを提案する。
エンコーダ内では、事前変調ネットワークがマルチスケール構造を利用して、より差別的なセマンティクスをスタイルベクトルにエンコードする。
忠実でフォトリアリスティックなイメージを再構築するために、シンプルだが効果的なSoft-update Mean Latentモジュールは、大規模な腐敗のために高忠実なテクスチャを合成する、より多様なドメイン内パターンをキャプチャするように設計されている。
論文 参考訳(メタデータ) (2022-08-25T03:39:24Z) - Interactive Image Inpainting Using Semantic Guidance [36.34615403590834]
本稿では,ユーザ自身の好みや記憶によってインペイント結果のカスタマイズを可能にする,新しい画像インペイント手法を提案する。
第1段階では、新規な空間的注意機構に基づくオートエンコーダを配置して、破損した画像の再構成特徴を生成する。
第2段階では、ユーザがカスタマイズしたセマンティックマスクによって導かれる微細な塗布結果を合成するために、予め再構成された特徴を取り入れたセマンティックデコーダが採用される。
論文 参考訳(メタデータ) (2022-01-26T05:09:42Z) - Learning Sparse Masks for Diffusion-based Image Inpainting [10.633099921979674]
拡散ベースの塗布はスパースデータから画像の再構成に強力なツールである。
我々は高効率な適応マスク生成モデルを提供する。
実験により,我々のモデルは最大4桁の加速度で競争品質を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-10-06T10:20:59Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - Inverting Generative Adversarial Renderer for Face Reconstruction [58.45125455811038]
本稿では,GAR(Generative Adversa Renderer)について紹介する。
GARは、グラフィックルールに頼るのではなく、複雑な現実世界のイメージをモデル化することを学ぶ。
本手法は,複数顔再構成における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-05-06T04:16:06Z) - R-MNet: A Perceptual Adversarial Network for Image Inpainting [5.471225956329675]
本稿では,新たな逆マスク演算子であるReverse Masking Network(R-MNet)と組み合わせたWasserstein GANを提案する。
提案手法は,高分解能な塗装作業に一般化でき,人間の視覚系に適応可能なよりリアルな出力を示す。
論文 参考訳(メタデータ) (2020-08-11T10:58:10Z) - High-Resolution Image Inpainting with Iterative Confidence Feedback and
Guided Upsampling [122.06593036862611]
既存の画像塗装法は、実アプリケーションで大きな穴を扱う際に、しばしばアーティファクトを生成する。
本稿では,フィードバック機構を備えた反復インペイント手法を提案する。
実験により,本手法は定量評価と定性評価の両方において既存手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2020-05-24T13:23:45Z) - Very Long Natural Scenery Image Prediction by Outpainting [96.8509015981031]
アウトペイントには2つの課題があるため、あまり注意を払わない。
第一の課題は、生成された画像と元の入力の間の空間的および内容的整合性を維持する方法である。
第2の課題は、生成した結果の高品質を維持する方法です。
論文 参考訳(メタデータ) (2019-12-29T16:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。