論文の概要: Enhanced Correlation Matching based Video Frame Interpolation
- arxiv url: http://arxiv.org/abs/2111.08869v1
- Date: Wed, 17 Nov 2021 02:43:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 14:42:48.113487
- Title: Enhanced Correlation Matching based Video Frame Interpolation
- Title(参考訳): 相関マッチングの強化によるビデオフレーム補間
- Authors: Sungho Lee, Narae Choi, Woong Il Choi
- Abstract要約: 拡張相関マッチングに基づくビデオフレーム補間ネットワークという新しいフレームワークを提案する。
提案手法では,光学的フロー推定のために,各ピラミッド層間のパラメータを共用する繰り返しピラミッド構造を用いる。
実験の結果,提案手法は4Kビデオデータや低解像度のベンチマークデータセット,客観的品質,主観的品質などにおいて,従来の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 5.304928339627251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel DNN based framework called the Enhanced Correlation
Matching based Video Frame Interpolation Network to support high resolution
like 4K, which has a large scale of motion and occlusion. Considering the
extensibility of the network model according to resolution, the proposed scheme
employs the recurrent pyramid architecture that shares the parameters among
each pyramid layer for optical flow estimation. In the proposed flow
estimation, the optical flows are recursively refined by tracing the location
with maximum correlation. The forward warping based correlation matching
enables to improve the accuracy of flow update by excluding incorrectly warped
features around the occlusion area. Based on the final bi-directional flows,
the intermediate frame at arbitrary temporal position is synthesized using the
warping and blending network and it is further improved by refinement network.
Experiment results demonstrate that the proposed scheme outperforms the
previous works at 4K video data and low-resolution benchmark datasets as well
in terms of objective and subjective quality with the smallest number of model
parameters.
- Abstract(参考訳): 本研究では,大規模動作とオクルージョンを有する4kのような高分解能をサポートするために,拡張相関マッチング型ビデオフレーム補間ネットワークと呼ばれる新しいdnnベースのフレームワークを提案する。
解像度に応じてネットワークモデルの拡張性を考慮すると,光学的フロー推定のために各ピラミッド層間でパラメータを共有する再帰ピラミッド構造が提案されている。
提案したフロー推定では,最大相関で位置を追従することにより,光学流を再帰的に洗練する。
前方整流に基づく相関マッチングにより、咬合領域周辺の不正確な整流特徴を除外し、フロー更新の精度を向上させることができる。
最終双方向流れに基づいて、任意の時間的位置の中間フレームをワーピング・ブレンドネットワークを用いて合成し、改良ネットワークによりさらに改善する。
実験結果から,提案手法は4Kビデオデータと低解像度のベンチマークデータセット,および最小数のモデルパラメータによる客観的および主観的品質において,従来よりも優れた性能を示した。
関連論文リスト
- Multiway Point Cloud Mosaicking with Diffusion and Global Optimization [74.3802812773891]
マルチウェイポイントクラウドモザイクのための新しいフレームワーク(水曜日)を紹介する。
我々のアプローチの核心は、重複を識別し、注意点を洗練する学習されたペアワイズ登録アルゴリズムODINである。
4つの多種多様な大規模データセットを用いて、我々の手法は、全てのベンチマークにおいて大きなマージンで、最先端のペアとローテーションの登録結果を比較した。
論文 参考訳(メタデータ) (2024-03-30T17:29:13Z) - OCAI: Improving Optical Flow Estimation by Occlusion and Consistency Aware Interpolation [55.676358801492114]
本稿では,中間映像フレームと光フローを同時に生成することで,フレームのあいまいさを頑健に支援するOCAIを提案する。
我々は,Sintel や KITTI などの既存のベンチマークにおいて,優れた品質と光フロー精度を実証した。
論文 参考訳(メタデータ) (2024-03-26T20:23:48Z) - Motion-Aware Video Frame Interpolation [49.49668436390514]
我々は、連続するフレームから中間光の流れを直接推定する動き対応ビデオフレーム補間(MA-VFI)ネットワークを導入する。
受容場が異なる入力フレームからグローバルな意味関係と空間的詳細を抽出するだけでなく、必要な計算コストと複雑さを効果的に削減する。
論文 参考訳(メタデータ) (2024-02-05T11:00:14Z) - Dynamic Frame Interpolation in Wavelet Domain [57.25341639095404]
ビデオフレームは、より流動的な視覚体験のためにフレームレートを上げることができる、重要な低レベルな計算ビジョンタスクである。
既存の手法は、高度なモーションモデルと合成ネットワークを利用することで大きな成功を収めた。
WaveletVFIは、同様の精度を維持しながら最大40%の計算を削減できるため、他の最先端技術に対してより効率的に処理できる。
論文 参考訳(メタデータ) (2023-09-07T06:41:15Z) - FDAN: Flow-guided Deformable Alignment Network for Video
Super-Resolution [12.844337773258678]
変形可能なコンボリューションに光流を統合するために,フロー誘導変形モジュール (FDM) を提案する。
FDANは、2つのベンチマークデータセットで最先端のパフォーマンスに達する。
論文 参考訳(メタデータ) (2021-05-12T13:18:36Z) - PDWN: Pyramid Deformable Warping Network for Video Interpolation [11.62213584807003]
Pyramid Deformable Warping Network (PDWN) と呼ばれる軽量かつ効果的なモデルを提案する。
PDWNはピラミッド構造を使用して、既知のフレームに関して未知の中間フレームのDConvオフセットを生成します。
提案手法は,複数のデータセットの最先端モデルと比較して精度が向上する。
論文 参考訳(メタデータ) (2021-04-04T02:08:57Z) - A Deep-Unfolded Reference-Based RPCA Network For Video
Foreground-Background Separation [86.35434065681925]
本稿では,ロバスト主成分分析(RPCA)問題に対するディープアンフォールディングに基づくネットワーク設計を提案する。
既存の設計とは異なり,本手法は連続するビデオフレームのスパース表現間の時間的相関をモデル化することに焦点を当てている。
移動MNISTデータセットを用いた実験により、提案したネットワークは、ビデオフォアグラウンドとバックグラウンドの分離作業において、最近提案された最先端のRPCAネットワークより優れていることが示された。
論文 参考訳(メタデータ) (2020-10-02T11:40:09Z) - FPCR-Net: Feature Pyramidal Correlation and Residual Reconstruction for
Optical Flow Estimation [72.41370576242116]
フレーム対からの光フロー推定のための半教師付き特徴ピラミッド相関・残留再構成ネットワーク(FPCR-Net)を提案する。
ピラミッド相関マッピングと残留再構成の2つの主要なモジュールで構成されている。
実験結果から,提案手法は,平均終点誤差 (AEE) に対して0.80, 1.15, 0.10の改善を達成し,最先端性能を実現していることがわかった。
論文 参考訳(メタデータ) (2020-01-17T07:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。