論文の概要: AnimeSR: Learning Real-World Super-Resolution Models for Animation
Videos
- arxiv url: http://arxiv.org/abs/2206.07038v1
- Date: Tue, 14 Jun 2022 17:57:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 13:24:34.564874
- Title: AnimeSR: Learning Real-World Super-Resolution Models for Animation
Videos
- Title(参考訳): AnimeSR: アニメーションビデオのための現実世界の超解法モデルを学ぶ
- Authors: Yanze Wu, Xintao Wang, Gen Li, Ying Shan
- Abstract要約: 本稿では,アニメーションビデオにおける実世界のビデオ超解像(VSR)の問題について検討し,実用的アニメーションVSRの3つの重要な改善点を明らかにする。
そこで本研究では,実際の低品質アニメーションビデオからこのような基本演算子を学習し,学習した演算子を劣化生成パイプラインに組み込むことを提案する。
提案手法であるAnimeSRは,実世界の低品質アニメーション映像を効果的かつ効率的に復元し,従来の最先端の手法よりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 23.71771590274543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the problem of real-world video super-resolution (VSR) for
animation videos, and reveals three key improvements for practical animation
VSR. First, recent real-world super-resolution approaches typically rely on
degradation simulation using basic operators without any learning capability,
such as blur, noise, and compression. In this work, we propose to learn such
basic operators from real low-quality animation videos, and incorporate the
learned ones into the degradation generation pipeline. Such
neural-network-based basic operators could help to better capture the
distribution of real degradations. Second, a large-scale high-quality animation
video dataset, AVC, is built to facilitate comprehensive training and
evaluations for animation VSR. Third, we further investigate an efficient
multi-scale network structure. It takes advantage of the efficiency of
unidirectional recurrent networks and the effectiveness of sliding-window-based
methods. Thanks to the above delicate designs, our method, AnimeSR, is capable
of restoring real-world low-quality animation videos effectively and
efficiently, achieving superior performance to previous state-of-the-art
methods.
- Abstract(参考訳): 本稿では,アニメーションビデオにおける実世界の超解像(VSR)の問題について検討し,実用的アニメーションVSRの3つの重要な改善点を明らかにする。
第一に、近年の現実世界の超解像法は、ブラー、ノイズ、圧縮などの学習能力を持たない基本演算子を用いた劣化シミュレーションに依存している。
本研究では,実際の低品質アニメーション映像から基本操作を学習し,学習した操作を劣化生成パイプラインに組み込む手法を提案する。
このようなニューラルネットワークベースの基本演算子は、実際の劣化の分布をよりよく捉えるのに役立つ。
第2に、アニメーションVSRの総合的なトレーニングと評価を容易にするために、大規模で高品質なアニメーションビデオデータセットであるAVCが構築されている。
第3に,効率的なマルチスケールネットワーク構造について検討する。
これは一方向リカレントネットワークの効率とスライディングウィンドウ方式の有効性を生かしている。
上記の繊細な設計のおかげで,我々の手法であるAnimeSRは,実世界の低品質アニメーション映像を効果的かつ効率的に復元することができ,従来の最先端の手法よりも優れた性能を実現することができる。
関連論文リスト
- Free Video-LLM: Prompt-guided Visual Perception for Efficient Training-free Video LLMs [56.040198387038025]
トレーニング不要ビデオLLMの効率的な推論のための新しいプロンプト誘導視覚認識フレームワーク(Free Video-LLM)を提案する。
提案手法は,複数のビデオ質問応答ベンチマークにおいて高い性能を維持しながら,視覚トークンの数を効果的に削減する。
論文 参考訳(メタデータ) (2024-10-14T12:35:12Z) - An Animation-based Augmentation Approach for Action Recognition from Discontinuous Video [11.293897932762809]
コンピュータビジョンの重要な構成要素である行動認識は、複数のアプリケーションにおいて重要な役割を果たす。
CNNは、不連続なビデオフレームでトレーニングされた場合、パフォーマンスの低下に悩まされる。
この問題を克服するために、一連の高度な技術を用いた4Aパイプラインを紹介します。
論文 参考訳(メタデータ) (2024-04-10T04:59:51Z) - VJT: A Video Transformer on Joint Tasks of Deblurring, Low-light
Enhancement and Denoising [45.349350685858276]
ビデオ復元作業は、低品質な観察から高品質な映像を復元することを目的としている。
ビデオはしばしば、ぼやけ、低照度、ノイズなど、さまざまな種類の劣化に直面します。
本稿では,映像の劣化,低照度化,雑音化といった共同作業に対して,効率的なエンドツーエンドビデオトランスフォーマ手法を提案する。
論文 参考訳(メタデータ) (2024-01-26T10:27:56Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - Learning Data-Driven Vector-Quantized Degradation Model for Animation
Video Super-Resolution [59.71387128485845]
アニメーションビデオの特徴を探求し、より実用的なアニメーションVSRモデルのための実世界のアニメーションデータの豊富な事前情報を活用する。
本稿では,グローバルな構造から局所的な詳細を分解する,マルチスケールなベクトル量子化分解モデルを提案する。
先行データを抽出するために、リッチコンテンツリアルアニメーション低品質(RAL)ビデオデータセットを収集する。
論文 参考訳(メタデータ) (2023-03-17T08:11:14Z) - Investigating Tradeoffs in Real-World Video Super-Resolution [90.81396836308085]
実世界のビデオ超解像(VSR)モデルは、一般化性を改善するために様々な劣化で訓練されることが多い。
最初のトレードオフを軽減するために,性能を犠牲にすることなく,最大40%のトレーニング時間を削減できる劣化手法を提案する。
そこで本研究では,多種多様な実世界の低品質映像系列を含むビデオLQデータセットを提案する。
論文 参考訳(メタデータ) (2021-11-24T18:58:21Z) - Real-Time Video Super-Resolution by Joint Local Inference and Global
Parameter Estimation [0.0]
本稿では,2つのデジタルカメラ撮像過程を異なるスケールでシミュレーションし,トレーニングデータの合成を行う新しい手法を提案する。
本手法は,両画像が自然画像の特性を有する画像対を生成する。
低消費電力エッジデバイスにビデオSRをリアルタイムに適用できる効率的なCNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-05-06T16:35:09Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - Deep Unrolled Network for Video Super-Resolution [0.45880283710344055]
ビデオスーパーリゾリューション(VSR)は、対応する低リゾリューション(LR)バージョンから高リゾリューション(HR)画像のシーケンスを再構築することを目的としています。
伝統的に、VSR問題の解法は、画像形成や動きの仮定に関する事前知識を利用する反復アルゴリズムに基づいている。
ディープラーニング(DL)アルゴリズムは、大量の画像から空間パターンを効率的に学習できます。
未使用の最適化技術に基づく新しいVSRニューラルネットワークを提案し,その性能を議論する。
論文 参考訳(メタデータ) (2021-02-23T14:35:09Z) - Video Face Super-Resolution with Motion-Adaptive Feedback Cell [90.73821618795512]
深部畳み込みニューラルネットワーク(CNN)の発展により,ビデオ超解像法(VSR)は近年,顕著な成功を収めている。
本稿では,動作補償を効率的に捕捉し,適応的にネットワークにフィードバックする,シンプルで効果的なブロックである動き適応型フィードバックセル(MAFC)を提案する。
論文 参考訳(メタデータ) (2020-02-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。