論文の概要: Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting
- arxiv url: http://arxiv.org/abs/2005.09704v1
- Date: Tue, 19 May 2020 18:55:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 14:33:54.433270
- Title: Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting
- Title(参考訳): 超高分解能画像塗布における残像集合
- Authors: Zili Yi, Qiang Tang, Shekoofeh Azizi, Daesik Jang, Zhan Xu
- Abstract要約: そこで本稿では,CRA(Contextual Residual Aggregation)機構を提案する。
CRA機構は、コンテキストパッチからの残基の重み付けにより、欠落した内容に対して高周波残基を生成する。
提案手法は,解像度512×512の小型画像に対して学習し,高解像度画像に対する推論を行い,良好な塗装品質を実現する。
- 参考スコア(独自算出の注目度): 12.839962012888199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently data-driven image inpainting methods have made inspiring progress,
impacting fundamental image editing tasks such as object removal and damaged
image repairing. These methods are more effective than classic approaches,
however, due to memory limitations they can only handle low-resolution inputs,
typically smaller than 1K. Meanwhile, the resolution of photos captured with
mobile devices increases up to 8K. Naive up-sampling of the low-resolution
inpainted result can merely yield a large yet blurry result. Whereas, adding a
high-frequency residual image onto the large blurry image can generate a sharp
result, rich in details and textures. Motivated by this, we propose a
Contextual Residual Aggregation (CRA) mechanism that can produce high-frequency
residuals for missing contents by weighted aggregating residuals from
contextual patches, thus only requiring a low-resolution prediction from the
network. Since convolutional layers of the neural network only need to operate
on low-resolution inputs and outputs, the cost of memory and computing power is
thus well suppressed. Moreover, the need for high-resolution training datasets
is alleviated. In our experiments, we train the proposed model on small images
with resolutions 512x512 and perform inference on high-resolution images,
achieving compelling inpainting quality. Our model can inpaint images as large
as 8K with considerable hole sizes, which is intractable with previous
learning-based approaches. We further elaborate on the light-weight design of
the network architecture, achieving real-time performance on 2K images on a GTX
1080 Ti GPU. Codes are available at: Atlas200dk/sample-imageinpainting-HiFill.
- Abstract(参考訳): 近年, 物体除去や損傷画像修復などの基本的な画像編集作業に影響を与え, インスピレーションを与えている。
これらの手法は古典的な手法よりも効果的であるが、メモリ制限のため、通常1Kより小さい低解像度の入力しか処理できない。
一方、モバイルデバイスで撮影した写真の解像度は最大8Kになる。
低解像度の塗装結果のナイーブアップサンプリングは、大きすぎるがぼやけた結果をもたらすだけである。
一方、大きなぼやけた画像に高周波残像を加えると、細部やテクスチャに富んだシャープな結果が得られる。
そこで本研究では,コンテキストパッチからの残差の重み付けにより,不足コンテンツに対する高頻度残差を生成できるコンテキスト残差凝集(CRA)機構を提案する。
ニューラルネットワークの畳み込み層は低解像度の入力と出力でのみ動作する必要があるため、メモリと計算パワーのコストは十分に抑制される。
さらに、高解像度のトレーニングデータセットの必要性も軽減されている。
提案するモデルを解像度512×512の小さな画像で訓練し,高画質画像の推論を行い,印象的な品質を実現する。
従来の学習に基づくアプローチでは難解な,8k程度の大きなホールサイズでイメージをインペイントすることが可能である。
我々は,gtx 1080 ti gpu上での2k画像のリアルタイム性能を実現するため,ネットワークアーキテクチャの軽量設計をさらに詳細に述べる。
Atlas200dk/sample-imageinpainting-HiFill のコードがある。
関連論文リスト
- CoordFill: Efficient High-Resolution Image Inpainting via Parameterized
Coordinate Querying [52.91778151771145]
本稿では,近年の連続的暗黙表現の発達により,その限界を初めて破ろうとする。
実験の結果,提案手法はGTX 2080 Ti GPUを用いて2048$times$2048の画像をリアルタイムに処理できることがわかった。
論文 参考訳(メタデータ) (2023-03-15T11:13:51Z) - LR-Net: A Block-based Convolutional Neural Network for Low-Resolution
Image Classification [0.0]
ノイズや低解像度の画像から低レベル特徴と大域特徴の両方を学習するためのブロックで構成された,新しい画像分類アーキテクチャを開発した。
ブロックの設計は,性能向上とパラメータサイズ削減のために,Residual ConnectionとInceptionモジュールの影響を強く受けていた。
我々は、提示されたアーキテクチャが既存の最先端畳み込みニューラルネットワークよりも高速で正確であることを示す詳細なテストを実施した。
論文 参考訳(メタデータ) (2022-07-19T20:01:11Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - Generating Superpixels for High-resolution Images with Decoupled Patch
Calibration [82.21559299694555]
Patch Networks (PCNet) は高解像度のスーパーピクセルセグメンテーションを効率的かつ正確に実装するように設計されている。
DPCは高解像度画像から局所パッチを取得し、動的にバイナリマスクを生成し、ネットワークを領域境界に集中させる。
特に、DPCは高解像度画像からローカルパッチを取り、動的にバイナリマスクを生成して、ネットワークを領域境界に集中させる。
論文 参考訳(メタデータ) (2021-08-19T10:33:05Z) - Exploiting Raw Images for Real-Scene Super-Resolution [105.18021110372133]
本稿では,合成データと実撮影画像とのギャップを埋めるために,実シーンにおける単一画像の超解像化の問題について検討する。
本稿では,デジタルカメラの撮像過程を模倣して,よりリアルなトレーニングデータを生成する手法を提案する。
また、原画像に記録された放射情報を活用するために、2分岐畳み込みニューラルネットワークを開発した。
論文 参考訳(メタデータ) (2021-02-02T16:10:15Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Deep Attentive Generative Adversarial Network for Photo-Realistic Image
De-Quantization [25.805568996596783]
減量子化は、高ビット深度画面に表示するための低ビット深度画像の視覚的品質を改善することができる。
本稿では,画像強度分解能の超解像を実現するためのDAGANアルゴリズムを提案する。
DenseResAttモジュールは、自己保持機構を備えた密集した残留ブロックで構成されている。
論文 参考訳(メタデータ) (2020-04-07T06:45:01Z) - Perceptual Image Super-Resolution with Progressive Adversarial Network [17.289101902846358]
Single Image Super-Resolution (SISR) は、小型の低画質画像の解像度を1つの画像から改善することを目的としている。
本稿では,現在最先端のアルゴリズムの性能を制限している理由として,次元の呪いを論じる。
本稿では,ドメイン固有画像の超解像化の難しさに対処できるプログレッシブ・アドバイサル・ネットワーク(PAN)を提案する。
論文 参考訳(メタデータ) (2020-03-08T10:19:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。