論文の概要: MambaOVSR: Multiscale Fusion with Global Motion Modeling for Chinese Opera Video Super-Resolution
- arxiv url: http://arxiv.org/abs/2511.06172v1
- Date: Sun, 09 Nov 2025 00:53:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.792693
- Title: MambaOVSR: Multiscale Fusion with Global Motion Modeling for Chinese Opera Video Super-Resolution
- Title(参考訳): MambaOVSR:中国オペラビデオスーパーリゾリューションのためのグローバルモーションモデリングによるマルチスケールフュージョン
- Authors: Hua Chang, Xin Xu, Wei Liu, Wei Wang, Xin Yuan, Kui Jiang,
- Abstract要約: 時空Opera Super-Resolution(MambaOVSR)のためのMambaベースの核融合ネットワークを提案する。
MambaOVSRは、マルチスケールの交互走査機構によるモーションモデリングのためのGlobal Fusion Module (GFM) と、異なるシーケンスの長さでアライメントするためのMultiscale Synergistic Mamba Module (MSMM) の3つの新しいコンポーネントを含んでいる。
COVCデータセットによる実験結果から,MambaOVSR は PSNR で平均 1.86 dB で SOTA STVSR 法を著しく上回っていることがわかった。
- 参考スコア(独自算出の注目度): 42.398756487635346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chinese opera is celebrated for preserving classical art. However, early filming equipment limitations have degraded videos of last-century performances by renowned artists (e.g., low frame rates and resolution), hindering archival efforts. Although space-time video super-resolution (STVSR) has advanced significantly, applying it directly to opera videos remains challenging. The scarcity of datasets impedes the recovery of high frequency details, and existing STVSR methods lack global modeling capabilities, compromising visual quality when handling opera's characteristic large motions. To address these challenges, we pioneer a large scale Chinese Opera Video Clip (COVC) dataset and propose the Mamba-based multiscale fusion network for space-time Opera Video Super-Resolution (MambaOVSR). Specifically, MambaOVSR involves three novel components: the Global Fusion Module (GFM) for motion modeling through a multiscale alternating scanning mechanism, and the Multiscale Synergistic Mamba Module (MSMM) for alignment across different sequence lengths. Additionally, our MambaVR block resolves feature artifacts and positional information loss during alignment. Experimental results on the COVC dataset show that MambaOVSR significantly outperforms the SOTA STVSR method by an average of 1.86 dB in terms of PSNR. Dataset and Code will be publicly released.
- Abstract(参考訳): 中国のオペラは古典芸術の保存のために祝われています。
しかし、初期の撮影機器の制限により、著名なアーティスト(例えば、低フレームレート、解像度)による前世紀の公演のビデオが劣化し、考古学的努力が妨げられている。
時空ビデオスーパーレゾリューション(STVSR)は大幅に進歩しているが、オペラビデオに直接適用することは依然として困難である。
データセットの不足は、高頻度の詳細の回復を妨げ、既存のSTVSR手法はグローバルなモデリング能力に欠け、オペラの特徴的な大きな動きを扱う際の視覚的品質を損なう。
これらの課題に対処するため、我々は大規模な中国のOpera Video Clip(COVC)データセットを考案し、時空のOpera Video Super-Resolution(MambaOVSR)のためのMambaベースのマルチスケールフュージョンネットワークを提案する。
特に、MambaOVSRは、マルチスケールの交互走査機構によるモーションモデリングのためのGlobal Fusion Module (GFM) と、異なるシーケンスの長さでアライメントするためのMultiscale Synergistic Mamba Module (MSMM) の3つの新しいコンポーネントを含んでいる。
さらに、我々のMambaVRブロックは、アライメント中の特徴アーチファクトと位置情報損失を解消する。
COVCデータセットによる実験結果から,MambaOVSR は PSNR で平均 1.86 dB で SOTA STVSR 法を著しく上回っていることがわかった。
DatasetとCodeは一般公開される。
関連論文リスト
- Trajectory-aware Shifted State Space Models for Online Video Super-Resolution [57.87099307245989]
本稿では、トラジェクトリ対応シフトSSM(TS-Mamba)に基づく新しいオンラインVSR手法を提案する。
TS-Mambaは、最初にビデオ内の軌跡を構築し、以前のフレームから最もよく似たトークンを選択する。
私たちのTS-Mambaは、ほとんどのケースで最先端のパフォーマンスを実現し、22.7%以上の削減複雑性(MAC)を実現しています。
論文 参考訳(メタデータ) (2025-08-14T08:42:15Z) - VSRM: A Robust Mamba-Based Framework for Video Super-Resolution [4.460886579535502]
ビデオの超高解像度化は、低レベルの視覚タスクにおいて依然として大きな課題である。
本研究では,ビデオ中の長いシーケンスを処理するための新しいフレームワークであるVSRMを提案する。
VSRMは様々なベンチマークで最先端の結果を達成し、将来の研究の基盤として確立している。
論文 参考訳(メタデータ) (2025-06-28T05:51:42Z) - M4V: Multi-Modal Mamba for Text-to-Video Generation [58.51139515986472]
テキスト・ビデオ・ジェネレーションはコンテンツを豊かにし、強力な世界シミュレータを作る可能性を秘めている。
広大な空間のモデリングは、特にシークエンス処理に二次的を利用する場合、計算的に要求される。
テキスト・ビデオ生成のためのマルチモーダル・マンバフレームワークを提案する。
テキストとビデオのベンチマーク実験では、M4Vが高品質なビデオを生成する能力を示しながら、計算コストを大幅に削減した。
論文 参考訳(メタデータ) (2025-06-12T17:29:40Z) - An Efficient and Mixed Heterogeneous Model for Image Restoration [71.85124734060665]
現在の主流のアプローチは、CNN、Transformers、Mambasの3つのアーキテクチャパラダイムに基づいている。
混合構造融合に基づく効率的で汎用的なIRモデルであるRestorMixerを提案する。
論文 参考訳(メタデータ) (2025-04-15T08:19:12Z) - MS-Temba : Multi-Scale Temporal Mamba for Efficient Temporal Action Detection [11.534493974662304]
未トリミングビデオにおける時間的行動検出(TAD)は、長期保存ビデオを効率的に処理できるモデルを必要とする。
我々は,多スケールテンポラルマンバ (MS-Temba) を提案する。
MS-Tembaは、長期ビデオの最先端のパフォーマンスを達成し、短いセグメントで競争力を維持し、モデルの複雑さを88%削減する。
論文 参考訳(メタデータ) (2025-01-10T17:52:47Z) - ReMamber: Referring Image Segmentation with Mamba Twister [51.291487576255435]
ReMamberは、マルチモーダルなMamba TwisterブロックとMambaのパワーを統合する新しいRISアーキテクチャである。
Mamba Twisterは画像とテキストのインタラクションを明示的にモデル化し、独自のチャネルと空間的ツイスト機構を通じてテキストと視覚的特徴を融合する。
論文 参考訳(メタデータ) (2024-03-26T16:27:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。