論文の概要: On the Generalization of BasicVSR++ to Video Deblurring and Denoising
- arxiv url: http://arxiv.org/abs/2204.05308v1
- Date: Mon, 11 Apr 2022 17:59:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 17:00:29.824954
- Title: On the Generalization of BasicVSR++ to Video Deblurring and Denoising
- Title(参考訳): ビデオデブラリングとデノジングに対するbasicvsr++の一般化について
- Authors: Kelvin C.K. Chan, Shangchen Zhou, Xiangyu Xu, Chen Change Loy
- Abstract要約: 我々は、BasicVSR++をビデオ復元タスクのための汎用フレームワークに拡張する。
入力と出力が同じ空間サイズを持つタスクでは、入力解像度はストライド畳み込みによって削減され効率が維持される。
BasicVSR++からの最小限の変更だけで、提案するフレームワークは、様々なビデオ復元タスクにおいて、非常に効率よく魅力的なパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 98.99165593274304
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The exploitation of long-term information has been a long-standing problem in
video restoration. The recent BasicVSR and BasicVSR++ have shown remarkable
performance in video super-resolution through long-term propagation and
effective alignment. Their success has led to a question of whether they can be
transferred to different video restoration tasks. In this work, we extend
BasicVSR++ to a generic framework for video restoration tasks. In tasks where
inputs and outputs possess identical spatial size, the input resolution is
reduced by strided convolutions to maintain efficiency. With only minimal
changes from BasicVSR++, the proposed framework achieves compelling performance
with great efficiency in various video restoration tasks including video
deblurring and denoising. Notably, BasicVSR++ achieves comparable performance
to Transformer-based approaches with up to 79% of parameter reduction and 44x
speedup. The promising results demonstrate the importance of propagation and
alignment in video restoration tasks beyond just video super-resolution. Code
and models are available at https://github.com/ckkelvinchan/BasicVSR_PlusPlus.
- Abstract(参考訳): 長期情報の利用は、ビデオ復元における長年の問題である。
最近の basicvsr と basicvsr++ は、長期の伝播と効果的なアライメントにより、ビデオの超解像性能が著しく向上している。
彼らの成功は、異なるビデオ復元タスクに転送できるかどうかという問題につながった。
本稿では, basicvsr++ をビデオ復元タスクのための汎用フレームワークに拡張する。
入力と出力が同じ空間サイズを持つタスクでは、入力解像度はストライド畳み込みによって削減され効率が維持される。
BasicVSR++からの最小限の変更だけで、提案フレームワークは、ビデオのデブロアリングやデノーミングを含む様々なビデオ復元タスクにおいて、非常に効率的なパフォーマンスを実現する。
特にbasicvsr++は、最大79%のパラメータ削減と44倍のスピードアップで、transformerベースのアプローチに匹敵するパフォーマンスを実現している。
ビデオ再生作業における伝播とアライメントの重要性は,ビデオ超解像以上のものである。
コードとモデルはhttps://github.com/ckkelvinchan/basicvsr_plusplusで入手できる。
関連論文リスト
- LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding [65.46303012350207]
LongVUは、長いビデオの視覚的詳細を保存しながら、ビデオトークンの数を減らす適応圧縮機構である。
DINOv2の機能を利用して、高い類似性を示す冗長なフレームを削除します。
時間的依存関係に基づいて,フレーム間の空間トークン削減を行う。
論文 参考訳(メタデータ) (2024-10-22T21:21:37Z) - Retargeting video with an end-to-end framework [14.270721529264929]
本稿では,動画を任意の比率に再ターゲティングするためのエンドツーエンドのRETVI手法を提案する。
私たちのシステムは、以前よりも品質と実行時間で優れています。
論文 参考訳(メタデータ) (2023-11-08T04:56:41Z) - A Codec Information Assisted Framework for Efficient Compressed Video
Super-Resolution [15.690562510147766]
リカレントニューラルネットワークアーキテクチャを用いたビデオ超解法(VSR)は、長距離時間依存性の効率的なモデリングのため、有望なソリューションである。
圧縮ビデオの繰り返しVSRモデルの高速化と高速化を目的としたコーデック情報支援フレームワーク(CIAF)を提案する。
論文 参考訳(メタデータ) (2022-10-15T08:48:29Z) - Sliding Window Recurrent Network for Efficient Video Super-Resolution [0.0]
ビデオ超解像(VSR)は、高解像度のフレームを低解像度の入力列から復元するタスクである。
本研究では,テキストスライディングウィンドウをベースとしたリカレントネットワーク(SWRN)を提案する。
筆者らはREDSデータセットを用いて,提案手法をモバイルデバイスに適用し,視覚的に快適な結果が得られることを示した。
論文 参考訳(メタデータ) (2022-08-24T15:23:44Z) - VideoINR: Learning Video Implicit Neural Representation for Continuous
Space-Time Super-Resolution [75.79379734567604]
ビデオインプリシットニューラル表現(Video Implicit Neural Representation, VideoINR)は任意の空間解像度とフレームレートの映像にデコード可能であることを示す。
本稿では,最新のSTVSR手法を用いて,一般的なアップサンプリングスケールにおいて,ビデオINRが競合性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-06-09T17:45:49Z) - Learning Trajectory-Aware Transformer for Video Super-Resolution [50.49396123016185]
ビデオ超解像は、高解像度(HR)フレームを低解像度(LR)フレームから復元することを目的としている。
既存のアプローチは通常、隣接する限られたフレームからビデオフレームを並べて集約する。
ビデオ超解像用トランスフォーマー(TTVSR)を提案する。
論文 参考訳(メタデータ) (2022-04-08T03:37:39Z) - Self-Conditioned Probabilistic Learning of Video Rescaling [70.10092286301997]
本稿では,ビデオ再スケーリングのための自己条件付き確率的フレームワークを提案し,ペアダウンスケーリングとアップスケーリングの手順を同時に学習する。
我々は、その条件付き確率を強い時空間事前情報に基づいて最大化することにより、ダウンスケーリングで失われた情報のエントロピーを減少させる。
我々は、このフレームワークを、非微分産業損失コーデックの勾配推定器として提案する、損失のあるビデオ圧縮システムに拡張する。
論文 参考訳(メタデータ) (2021-07-24T15:57:15Z) - BasicVSR++: Improving Video Super-Resolution with Enhanced Propagation
and Alignment [90.81396836308085]
我々は,伝播とアライメントの強化による再生フレームワークの強化により,映像情報をより効果的に活用できることを示す。
我々のモデルである BasicVSR++ は PSNR で BasicVSR を 0.82 dB で上回っている。
BasicVSR++は圧縮ビデオ強化などの他のビデオ復元タスクによく一般化される。
論文 参考訳(メタデータ) (2021-04-27T17:58:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。