論文の概要: STDAN: Deformable Attention Network for Space-Time Video
Super-Resolution
- arxiv url: http://arxiv.org/abs/2203.06841v1
- Date: Mon, 14 Mar 2022 03:40:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 16:02:22.808528
- Title: STDAN: Deformable Attention Network for Space-Time Video
Super-Resolution
- Title(参考訳): STDAN:時空ビデオスーパーリゾリューションのための変形可能なアテンションネットワーク
- Authors: Hai Wang, Xiaoyu Xiang, Yapeng Tian, Wenming Yang, Qingmin Liao
- Abstract要約: 本稿では,STDAN と呼ばれる,STVSR のための変形可能なアテンションネットワークを提案する。
まず、より近隣の入力フレームから豊富なコンテンツを得ることができるLSTFI(long-short term feature)モジュールを考案する。
第2に,空間的・時間的文脈を適応的に捕捉・集約する時空間変形可能特徴集合(STDFA)モジュールを提案する。
- 参考スコア(独自算出の注目度): 39.18399652834573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The target of space-time video super-resolution (STVSR) is to increase the
spatial-temporal resolution of low-resolution (LR) and low frame rate (LFR)
videos. Recent approaches based on deep learning have made significant
improvements, but most of them only use two adjacent frames, that is,
short-term features, to synthesize the missing frame embedding, which suffers
from fully exploring the information flow of consecutive input LR frames. In
addition, existing STVSR models hardly exploit the temporal contexts explicitly
to assist high-resolution (HR) frame reconstruction. To address these issues,
in this paper, we propose a deformable attention network called STDAN for
STVSR. First, we devise a long-short term feature interpolation (LSTFI) module,
which is capable of excavating abundant content from more neighboring input
frames for the interpolation process through a bidirectional RNN structure.
Second, we put forward a spatial-temporal deformable feature aggregation
(STDFA) module, in which spatial and temporal contexts in dynamic video frames
are adaptively captured and aggregated to enhance SR reconstruction.
Experimental results on several datasets demonstrate that our approach
outperforms state-of-the-art STVSR methods.
- Abstract(参考訳): STVSRの目的は、低解像度(LR)ビデオと低フレームレート(LFR)ビデオの時空間分解能を高めることである。
深層学習に基づく最近のアプローチは大幅に改善されているが、そのほとんどは隣接する2つのフレーム(短期的な特徴)のみを用いて、連続的な入力LRフレームの情報フローを十分に探索することのできないフレーム埋め込みを合成している。
さらに、既存のSTVSRモデルは、高解像度(HR)フレーム再構築を支援するために、時間的コンテキストを明示的に利用し難い。
本稿では,STVSRにおけるSTDANと呼ばれる変形可能なアテンションネットワークを提案する。
まず,LSTFI(Long-short term feature interpolation)モジュールを設計し,より隣接する入力フレームから多量のコンテンツを抽出し,双方向のRNN構造を通して補間処理を行う。
次に,動的ビデオフレームの空間的および時間的コンテキストを適応的にキャプチャし,sr再構成を促進させる空間的-時空間的変形可能な特徴集約(stdfa)モジュールを提案する。
いくつかのデータセットに対する実験結果から,本手法は最先端のSTVSR法より優れていることが示された。
関連論文リスト
- Continuous Space-Time Video Super-Resolution Utilizing Long-Range
Temporal Information [48.20843501171717]
本稿では,任意のフレームレートと空間解像度に変換可能な連続ST-VSR(CSTVSR)手法を提案する。
本稿では,提案アルゴリズムの柔軟性が向上し,各種データセットの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-02-26T08:02:39Z) - Temporal Consistency Learning of inter-frames for Video Super-Resolution [38.26035126565062]
ビデオ超解像(VSR)は、低解像度(LR)参照フレームと複数の隣接フレームから高解像度(HR)フレームを再構成することを目的としたタスクである。
既存の手法は一般に情報伝達とフレームアライメントを探求し、VSRの性能を向上させる。
本稿では,再建されたビデオの一貫性を高めるため,VSRのための時間一貫性学習ネットワーク(TCNet)を提案する。
論文 参考訳(メタデータ) (2022-11-03T08:23:57Z) - Enhancing Space-time Video Super-resolution via Spatial-temporal Feature
Interaction [9.456643513690633]
時空ビデオ超解像(STVSR)の目的は、ビデオのフレームレートと空間解像度の両方を増加させることである。
近年のアプローチでは、エンドツーエンドのディープニューラルネットワークを用いてSTVSRを解く。
本研究では,空間的・時間的相関を利用してSTVSRを強化する空間的・時間的特徴相互作用ネットワークを提案する。
論文 参考訳(メタデータ) (2022-07-18T22:10:57Z) - Optical-Flow-Reuse-Based Bidirectional Recurrent Network for Space-Time
Video Super-Resolution [52.899234731501075]
時空間ビデオ超解像(ST-VSR)は、与えられたビデオの空間解像度とフレームレートを同時に増加させる。
既存の手法は通常、近隣の幅広いフレームからの情報を効率的に活用する方法の難しさに悩まされる。
本稿では,隣接するフレーム間の知識を活用するために,ConvLSTMの代わりに粗大な双方向リカレントニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-13T15:21:30Z) - Temporal Modulation Network for Controllable Space-Time Video
Super-Resolution [66.06549492893947]
宇宙時間のビデオ超解像度は、低解像度と低フレームレートのビデオの空間的および時間的解像度を高めることを目指しています。
変形性畳み込み法は、有望なSTVSR性能を達成したが、トレーニング段階で事前に定義された中間フレームのみを推測することができた。
本稿では,任意の中間フレームを高精度な高分解能再構成で補間する時間変調ネットワーク(tmnet)を提案する。
論文 参考訳(メタデータ) (2021-04-21T17:10:53Z) - Zooming SlowMo: An Efficient One-Stage Framework for Space-Time Video
Super-Resolution [100.11355888909102]
時空ビデオ超解像度は低解像度(LR)と低フレームレート(LFR)ビデオシーケンスから高解像度(HR)スローモーションビデオを生成することを目的としている。
入力LRおよびLFRビデオから直接HRスローモーション映像シーケンスを再構成できる一段階の時空間ビデオ超解像フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-15T17:59:23Z) - Zooming Slow-Mo: Fast and Accurate One-Stage Space-Time Video
Super-Resolution [95.26202278535543]
単純な解決策は、ビデオフレーム(VFI)とビデオ超解像(VSR)の2つのサブタスクに分割することである。
時間合成と空間超解像はこの課題に関係している。
LFR,LRビデオからHRスローモーション映像を直接合成するワンステージ時空間ビデオ超解像フレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-26T16:59:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。