論文の概要: Blind Non-Uniform Motion Deblurring using Atrous Spatial Pyramid
Deformable Convolution and Deblurring-Reblurring Consistency
- arxiv url: http://arxiv.org/abs/2106.14336v1
- Date: Sun, 27 Jun 2021 23:14:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:05:41.063532
- Title: Blind Non-Uniform Motion Deblurring using Atrous Spatial Pyramid
Deformable Convolution and Deblurring-Reblurring Consistency
- Title(参考訳): Arous Space Pyramid Deformable Convolution and Deblurring-Reblurring Consistency を用いたブラインド非一様運動障害
- Authors: Dong Huo, Abbas Masoumzadeh, Yee-Hong Yang
- Abstract要約: 複数のAtrous Space Pyramid Deformable Convolutionモジュールからなる新しいアーキテクチャを提案する。
複数のASPDCモジュールは、同じ層内で異なるディレーションレートで画素固有の動きを暗黙的に学習し、異なる大きさの動きを処理する。
実験の結果,提案手法はベンチマークデータセット上での最先端手法よりも優れていた。
- 参考スコア(独自算出の注目度): 5.994412766684843
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Many deep learning based methods are designed to remove non-uniform
(spatially variant) motion blur caused by object motion and camera shake
without knowing the blur kernel. Some methods directly output the latent sharp
image in one stage, while others utilize a multi-stage strategy (\eg
multi-scale, multi-patch, or multi-temporal) to gradually restore the sharp
image. However, these methods have the following two main issues: 1) The
computational cost of multi-stage is high; 2) The same convolution kernel is
applied in different regions, which is not an ideal choice for non-uniform
blur. Hence, non-uniform motion deblurring is still a challenging and open
problem. In this paper, we propose a new architecture which consists of
multiple Atrous Spatial Pyramid Deformable Convolution (ASPDC) modules to
deblur an image end-to-end with more flexibility. Multiple ASPDC modules
implicitly learn the pixel-specific motion with different dilation rates in the
same layer to handle movements of different magnitude. To improve the training,
we also propose a reblurring network to map the deblurred output back to the
blurred input, which constrains the solution space. Our experimental results
show that the proposed method outperforms state-of-the-art methods on the
benchmark datasets.
- Abstract(参考訳): 深層学習に基づく多くの手法は、ぼやけたカーネルを知らずに、物体の動きやカメラの揺れによって生じる、一様でない動きのぼやけを取り除くように設計されている。
潜伏シャープ画像を1段階で直接出力する方法もあれば、マルチステージ戦略(マルチスケール、マルチパッチ、マルチテンポラル)を使用して徐々にシャープイメージを復元する手法もある。
しかし、これらの手法には以下の2つの主要な問題がある: 1) マルチステージの計算コストが高い; 2) 同じ畳み込みカーネルは異なる領域に適用されるが、これは非一様ぼけの理想的な選択ではない。
したがって、非一様運動のデブロワーリングは依然として困難でオープンな問題である。
本稿では,複数のアトラスな空間ピラミッド変形可能な畳み込み(aspdc)モジュールからなる新しいアーキテクチャを提案する。
複数のASPDCモジュールは、異なるディレーションレートのピクセル固有の動きを暗黙的に学習し、異なる大きさの動きを処理する。
また, 学習を改善するために, 解空間を制約するぼやけた入力に対して, ぼやけた出力をマッピングする再バッファリングネットワークを提案する。
実験の結果,提案手法はベンチマークデータセットの最先端手法よりも優れていた。
関連論文リスト
- Motion-adaptive Separable Collaborative Filters for Blind Motion Deblurring [71.60457491155451]
様々な動きによって生じる画像のぼかしを除去することは、難しい問題である。
本研究では,動き適応型分離型協調フィルタと呼ばれる実世界のデブロアリングフィルタモデルを提案する。
本手法は,実世界の動きのぼかし除去に有効な解法を提供し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-04-19T19:44:24Z) - Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.36888929483233]
そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文 参考訳(メタデータ) (2023-12-29T02:59:40Z) - A Constrained Deformable Convolutional Network for Efficient Single
Image Dynamic Scene Blind Deblurring with Spatially-Variant Motion Blur
Kernels Estimation [12.744989551644744]
本稿では,効率的なシングルイメージダイナミックシーンブラインドブルのための制約付き変形可能な畳み込みネットワーク(CDCN)を提案する。
CDCNは、高精度な空間変動運動ぼかしカーネル推定と高品質な画像復元を同時に達成する。
論文 参考訳(メタデータ) (2022-08-23T03:28:21Z) - Animation from Blur: Multi-modal Blur Decomposition with Motion Guidance [83.25826307000717]
単一の動き赤画像から詳細な動きを復元する際の課題について検討する。
既存の解法では、各領域の運動のあいまいさを考慮せずに単一の画像列を推定する。
本稿では、このような動きのあいまいさを明示的に説明し、複数の可算解をシャープな詳細で生成することができる。
論文 参考訳(メタデータ) (2022-07-20T18:05:53Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - Single Image Non-uniform Blur Kernel Estimation via Adaptive Basis
Decomposition [1.854931308524932]
本研究では,高密度な非一様運動ボケ推定のための一般非パラメトリックモデルを提案する。
提案手法は,既存の不均一な動きのぼかし推定の限界を克服することを示す。
論文 参考訳(メタデータ) (2021-02-01T18:02:31Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - Monocular, One-stage, Regression of Multiple 3D People [105.3143785498094]
我々は、複数の3D人物(ROMP)のための1段階方式で全てのメッシュを回帰することを提案する。
本手法は,体温マップとメッシュマップを同時に予測し,画素レベルの3Dボディメッシュを共同で記述する。
最先端の手法と比較して、ROMPは挑戦的なマルチパーソンベンチマークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-08-27T17:21:47Z) - MuCAN: Multi-Correspondence Aggregation Network for Video
Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。
フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。
VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文 参考訳(メタデータ) (2020-07-23T05:41:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。