論文の概要: Pyramid Feature Alignment Network for Video Deblurring
- arxiv url: http://arxiv.org/abs/2203.14556v1
- Date: Mon, 28 Mar 2022 07:54:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 15:32:27.437657
- Title: Pyramid Feature Alignment Network for Video Deblurring
- Title(参考訳): 映像分解のためのピラミッド特徴アライメントネットワーク
- Authors: Leitian Tao and Zhenzhong Chen
- Abstract要約: ビデオの劣化は、さまざまな原因がぼやけているため、難しい課題だ。
従来の方法では、隣接するフレームを単一スケールのアライメントで修復する方法が検討されてきた。
本稿では,映像デブリのためのピラミッド特徴アライメントネットワーク(PFAN)を提案する。
- 参考スコア(独自算出の注目度): 63.26197177542422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Video deblurring remains a challenging task due to various causes of
blurring. Traditional methods have considered how to utilize neighboring frames
by the single-scale alignment for restoration. However, they typically suffer
from misalignment caused by severe blur. In this work, we aim to better utilize
neighboring frames with high efficient feature alignment. We propose a Pyramid
Feature Alignment Network (PFAN) for video deblurring. First, the multi-scale
feature of blurry frames is extracted with the strategy of Structure-to-Detail
Downsampling (SDD) before alignment. This downsampling strategy makes the edges
sharper, which is helpful for alignment. Then we align the feature at each
scale and reconstruct the image at the corresponding scale. This strategy
effectively supervises the alignment at each scale, overcoming the problem of
propagated errors from the above scales at the alignment stage. To better
handle the challenges of complex and large motions, instead of aligning
features at each scale separately, lower-scale motion information is used to
guide the higher-scale motion estimation. Accordingly, a Cascade Guided
Deformable Alignment (CGDA) is proposed to integrate coarse motion into
deformable convolution for finer and more accurate alignment. As demonstrated
in extensive experiments, our proposed PFAN achieves superior performance with
competitive speed compared to the state-of-the-art methods.
- Abstract(参考訳): ぼやけた原因がいろいろあるため、ビデオデブラリングは依然として難しい課題である。
従来の方法では、隣接するフレームを単一スケールのアライメントで修復する方法が検討されてきた。
しかし、通常は深刻なぼやけによる誤認に苦しむ。
本研究では,隣接するフレームを高効率な特徴アライメントで活用することを目的としている。
本稿では,映像デブリのためのピラミッド特徴アライメントネットワーク(PFAN)を提案する。
まず,アライメント前のSDD(Structure-to-Detail Downsampling)戦略を用いて,ぼやけたフレームのマルチスケール特徴を抽出する。
このダウンサンプリング戦略はエッジをよりシャープにし、アライメントに役立つ。
そして、各スケールで特徴を整列し、対応するスケールで画像を再構成する。
この戦略は、各スケールでのアライメントを効果的に監視し、アライメント段階における上記のスケールからのプロパゲートエラーの問題を克服する。
複雑な動きや大きな動きの課題をよりうまく扱うために、各スケールの特徴を個別に調整するのではなく、より大規模な動き推定を導くために低レベルの動き情報を使用する。
そこで, より高精度なアライメントのために, 変形可能な畳み込みに粗い動きを統合するために, カスケード誘導変形可能アライメント (cgda) を提案する。
広範な実験で示されたように,提案するPFANは,最先端手法と比較して,競争速度に優れた性能を発揮する。
関連論文リスト
- Aggregating Long-term Sharp Features via Hybrid Transformers for Video
Deblurring [76.54162653678871]
本稿では,特徴集約のためのハイブリッドトランスフォーマーを用いて,隣接するフレームとシャープフレームの両方を活用するビデオデブロアリング手法を提案する。
提案手法は,定量的な計測値と視覚的品質の観点から,最先端のビデオデブロアリング法,およびイベント駆動ビデオデブロアリング法より優れる。
論文 参考訳(メタデータ) (2023-09-13T16:12:11Z) - Pointless Global Bundle Adjustment With Relative Motions Hessians [0.0]
本稿では,画像特徴の再投影誤差に依存しない新しいバンドル調整手法を提案する。
本手法は, 構造物の寄与を暗黙的に反映しながら, 相対的な動きを平均化する。
我々は、この手法がモーション平均化手法のアップグレード版であり、フォトグラムデータセットとコンピュータビジョンベンチマークの両方でその効果を実証していると論じる。
論文 参考訳(メタデータ) (2023-04-11T10:20:32Z) - Towards Nonlinear-Motion-Aware and Occlusion-Robust Rolling Shutter
Correction [54.00007868515432]
既存の手法では、一様速度仮定による補正の精度を推定する上で、課題に直面している。
本稿では,個々の画素の高次補正場を正確に推定する,幾何的回転シャッター(QRS)運動解法を提案する。
提案手法は,Carla-RS,Fastec-RS,BS-RSCの各データセット上で,PSNRの+4.98,+0.77,+4.33を超える。
論文 参考訳(メタデータ) (2023-03-31T15:09:18Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - Exploring Motion Ambiguity and Alignment for High-Quality Video Frame
Interpolation [46.02120172459727]
本稿では,GTに近い中間フレームを可能な限り再構築する要件を緩和することを提案する。
本研究では,テクスチャ整合性損失 (TCL) を補間されたコンテンツが,与えられたフレーム内でのテクスチャ整合性損失 (TCL) と類似した構造を維持するべきであるという仮定に基づいて開発する。
論文 参考訳(メタデータ) (2022-03-19T10:37:06Z) - Recurrent Video Deblurring with Blur-Invariant Motion Estimation and
Pixel Volumes [14.384467317051831]
本稿では,複数のビデオフレームから情報を効果的に集約することで,映像をブルーリングする2つの新しい手法を提案する。
まず、ぼやけたフレーム間の動き推定精度を向上させるために、ぼやけた不変な動き推定学習を提案する。
第二に、動き補正のために、推定した動きを歪ませてフレームを整列する代わりに、被写体がシャープな画素を含む画素体積を用いて、動き推定誤差を解消する。
論文 参考訳(メタデータ) (2021-08-23T07:36:49Z) - ARVo: Learning All-Range Volumetric Correspondence for Video Deblurring [92.40655035360729]
ビデオデブラリングモデルは連続フレームを利用して、カメラの揺動や物体の動きからぼやけを取り除く。
特徴空間におけるボケフレーム間の空間的対応を学習する新しい暗黙的手法を提案する。
提案手法は,新たに収集したビデオデブレーション用ハイフレームレート(1000fps)データセットとともに,広く採用されているDVDデータセット上で評価される。
論文 参考訳(メタデータ) (2021-03-07T04:33:13Z) - Adaptively Meshed Video Stabilization [32.68960056325736]
本稿では,すべての特徴軌跡と適応的ブロッキング戦略に基づいて,ゆるやかな映像を安定化するための適応的メッシュ化手法を提案する。
2段階最適化問題を解くことにより,各フレームのメッシュベースの変換を推定する。
論文 参考訳(メタデータ) (2020-06-14T06:51:23Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。