論文の概要: Rethinking Data Augmentation for Image Super-resolution: A Comprehensive
Analysis and a New Strategy
- arxiv url: http://arxiv.org/abs/2004.00448v2
- Date: Thu, 23 Apr 2020 08:28:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 19:21:58.179637
- Title: Rethinking Data Augmentation for Image Super-resolution: A Comprehensive
Analysis and a New Strategy
- Title(参考訳): 画像超解像のためのデータ拡張の再考:包括的分析と新しい戦略
- Authors: Jaejun Yoo, Namhyuk Ahn, Kyung-Ah Sohn
- Abstract要約: 超分解能タスクに適用された既存の拡張手法を包括的に分析する。
我々は、低解像度のパッチをカットし、それに対応する高解像度の画像領域にペーストするCutBlurを提案する。
提案手法は, 様々なシナリオにおいて連続的に, 性能を著しく向上させる。
- 参考スコア(独自算出の注目度): 21.89072742618842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is an effective way to improve the performance of deep
networks. Unfortunately, current methods are mostly developed for high-level
vision tasks (e.g., classification) and few are studied for low-level vision
tasks (e.g., image restoration). In this paper, we provide a comprehensive
analysis of the existing augmentation methods applied to the super-resolution
task. We find that the methods discarding or manipulating the pixels or
features too much hamper the image restoration, where the spatial relationship
is very important. Based on our analyses, we propose CutBlur that cuts a
low-resolution patch and pastes it to the corresponding high-resolution image
region and vice versa. The key intuition of CutBlur is to enable a model to
learn not only "how" but also "where" to super-resolve an image. By doing so,
the model can understand "how much", instead of blindly learning to apply
super-resolution to every given pixel. Our method consistently and
significantly improves the performance across various scenarios, especially
when the model size is big and the data is collected under real-world
environments. We also show that our method improves other low-level vision
tasks, such as denoising and compression artifact removal.
- Abstract(参考訳): データ拡張はディープネットワークの性能を改善する効果的な方法である。
残念ながら、現在の手法は主に高レベルの視覚タスク(例えば分類)のために開発されており、低レベルの視覚タスク(例えば画像復元)のために研究されているものはほとんどない。
本稿では,超解像課題に適用された既存の拡張手法を包括的に分析する。
空間的関係が極めて重要である画像復元において,画素を破棄あるいは操作する手法が画像復元を妨げすぎることが判明した。
そこで本研究では,低解像度のパッチをカットし,対応する高解像度の画像領域に貼り付けるCutBlurを提案する。
cutblurの重要な直観は、モデルが「方法」だけでなく「どこで」イメージを超解くかを学習できるようにすることである。
そうすることで、各ピクセルに超解像度を適用することを盲目的に学習する代わりに、モデルは「どれだけ」理解することができる。
提案手法は, モデルサイズが大きく, 実環境下でデータ収集を行う場合において, 様々なシナリオにおける性能を, 一貫して, 著しく向上させる。
また,本手法は,デノベーションや圧縮アーティファクトの除去など,他の低レベル視覚タスクを改善していることを示す。
関連論文リスト
- Research on Image Super-Resolution Reconstruction Mechanism based on Convolutional Neural Network [8.739451985459638]
超解像アルゴリズムは、同一シーンから撮影された1つ以上の低解像度画像を高解像度画像に変換する。
再構成過程における画像の特徴抽出と非線形マッピング手法は,既存のアルゴリズムでは依然として困難である。
目的は、高解像度の画像から高品質で高解像度の画像を復元することである。
論文 参考訳(メタデータ) (2024-07-18T06:50:39Z) - On the Effect of Image Resolution on Semantic Segmentation [27.115235051091663]
本研究では,高分解能セグメンテーションを直接生成できるモデルが,より複雑なシステムの性能と一致することを示す。
提案手法は,ボトムアップ情報伝搬手法を様々なスケールで活用する。
先進的なセマンティックセグメンテーションデータセットを用いて,本手法を厳格に検証した。
論文 参考訳(メタデータ) (2024-02-08T04:21:30Z) - Unsupervised Deep Learning-based Pansharpening with Jointly-Enhanced
Spectral and Spatial Fidelity [4.425982186154401]
本稿では,この手法の可能性をフル活用した,ディープラーニングに基づくパンシャーピングモデルを提案する。
提案モデルでは,パンシャーペンデータのスペクトルと空間的品質を協調的に向上する新たな損失関数を特徴とする。
挑戦的なシナリオで実施された多種多様なテスト画像の実験により,提案手法が技術状況と良好に比較できることが実証された。
論文 参考訳(メタデータ) (2023-07-26T17:25:28Z) - Super-Resolving Face Image by Facial Parsing Information [52.1267613768555]
顔超解像は、低解像度の顔画像を対応する高解像度の画像に変換する技術である。
我々は,低解像度の顔画像から先行する顔を抽出する,新しい解析マップ付き顔超解像ネットワークを構築した。
高解像度特徴はより正確な空間情報を含み、低解像度特徴は強い文脈情報を提供する。
論文 参考訳(メタデータ) (2023-04-06T08:19:03Z) - Toward Super-Resolution for Appearance-Based Gaze Estimation [4.594159253008448]
超解像度は視覚的観点から画質を改善することが示されている。
本稿では,SwinIR超解像モデルに基づく2段階のフレームワークを提案する。
自己教師付き学習は、ダウンストリームタスクに必要なラベル付きデータの量を減らすために、ラベルのないデータから学習することを目的としている。
論文 参考訳(メタデータ) (2023-03-17T17:40:32Z) - Learning Degradation Representations for Image Deblurring [37.80709422920307]
ぼやけた画像の空間適応的劣化表現を学習するための枠組みを提案する。
劣化表現の表現性を改善するために、新しい共同画像再生・復調学習プロセスを提案する。
GoProとRealBlurのデータセットの実験では、学習した劣化表現を用いたデブロアリングフレームワークが最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2022-08-10T09:53:16Z) - Learning Weighting Map for Bit-Depth Expansion within a Rational Range [64.15915577164894]
ビット深化(BDE)は、低ビット深化(LBD)ソースから高ビット深化(HBD)画像を表示する新興技術の1つである。
既存のBDEメソッドは、様々なBDE状況に対して統一的なソリューションを持っていない。
我々は,各画素の重みを求めるためにビット復元ネットワーク(BRNet)を設計し,補充値の比率を合理的範囲内で示す。
論文 参考訳(メタデータ) (2022-04-26T02:27:39Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。