論文の概要: Feature Refinement to Improve High Resolution Image Inpainting
- arxiv url: http://arxiv.org/abs/2206.13644v2
- Date: Wed, 29 Jun 2022 18:16:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-02 18:00:04.775274
- Title: Feature Refinement to Improve High Resolution Image Inpainting
- Title(参考訳): 高精細化による高精細化
- Authors: Prakhar Kulshreshtha, Brian Pugh and Salma Jiddi
- Abstract要約: 塗装ネットワークは、トレーニングセットよりも高い解像度でグローバルコヒーレントな構造を生成できないことが多い。
推論におけるマルチスケールの一貫性損失を最小限に抑えることにより,ネットワークの中間的特徴マップを最適化する。
このランタイム最適化は、塗装結果を改善し、高分解能塗装のための新しい最先端技術を確立する。
- 参考スコア(独自算出の注目度): 1.4824891788575418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we address the problem of degradation in inpainting quality of
neural networks operating at high resolutions. Inpainting networks are often
unable to generate globally coherent structures at resolutions higher than
their training set. This is partially attributed to the receptive field
remaining static, despite an increase in image resolution. Although downscaling
the image prior to inpainting produces coherent structure, it inherently lacks
detail present at higher resolutions. To get the best of both worlds, we
optimize the intermediate featuremaps of a network by minimizing a multiscale
consistency loss at inference. This runtime optimization improves the
inpainting results and establishes a new state-of-the-art for high resolution
inpainting. Code is available at:
https://github.com/geomagical/lama-with-refiner/tree/refinement.
- Abstract(参考訳): 本稿では,高分解能で動作するニューラルネットワークの塗装品質の劣化問題に対処する。
塗装ネットワークは、トレーニングセットよりも高い解像度でグローバルコヒーレントな構造を生成できないことが多い。
これは画像解像度が増大しているにもかかわらず、受容野が静止しているためである。
塗装前の画像の縮小はコヒーレントな構造を生み出すが、高解像度で現れる詳細は本質的に欠落している。
両世界を最大限に活用するために、推論におけるマルチスケールの一貫性損失を最小限に抑えて、ネットワークの中間機能マップを最適化する。
このランタイム最適化は、塗装結果を改善し、高解像度塗装のための新しい最先端技術を確立する。
コードは、https://github.com/geomagical/lama-with-refiner/tree/refinementで入手できる。
関連論文リスト
- T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - A Wasserstein GAN for Joint Learning of Inpainting and its Spatial
Optimisation [3.4392739159262145]
空間的インペイントデータ最適化のための最初の生成逆ネットワークを提案する。
従来のアプローチとは対照的に、着色発電機とそれに対応するマスクネットワークのジョイントトレーニングが可能である。
これにより、従来のモデルよりも視覚的品質とスピードが大幅に向上し、現在の最適化ネットワークよりも優れています。
論文 参考訳(メタデータ) (2022-02-11T14:02:36Z) - Resolution-robust Large Mask Inpainting with Fourier Convolutions [10.152370311844445]
塗装システムは、大きな欠落した領域、複雑な幾何学構造、高解像度の画像にしばしば苦労する。
その主な原因の1つは、塗装ネットワークと損失関数の両方において、効果的な受容野が欠如していることである。
本稿では,この問題を緩和するために,大型マスク塗装 (LaMa) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T08:54:29Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - Zoom-to-Inpaint: Image Inpainting with High-Frequency Details [39.582275854002994]
高分解能で精錬し、出力を元の解像度に縮小する超解像法を提案します。
精細化ネットワークに高精細画像を導入することで、スペクトルバイアスによって通常滑らかになる細部を再構築することができる。
当社のズームイン、精緻化、ズームアウト戦略は、高解像度の監視とプログレッシブラーニングと組み合わせることで、高周波の詳細を高めるためのフレームワークに依存しないアプローチを構成します。
論文 参考訳(メタデータ) (2020-12-17T05:39:37Z) - Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting [12.839962012888199]
そこで本稿では,CRA(Contextual Residual Aggregation)機構を提案する。
CRA機構は、コンテキストパッチからの残基の重み付けにより、欠落した内容に対して高周波残基を生成する。
提案手法は,解像度512×512の小型画像に対して学習し,高解像度画像に対する推論を行い,良好な塗装品質を実現する。
論文 参考訳(メタデータ) (2020-05-19T18:55:32Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。