論文の概要: BVI-Mamba: Video Enhancement Using a Visual State-Space Model for Low-Light and Underwater Environments
- arxiv url: http://arxiv.org/abs/2604.23655v1
- Date: Sun, 26 Apr 2026 11:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.484526
- Title: BVI-Mamba: Video Enhancement Using a Visual State-Space Model for Low-Light and Underwater Environments
- Title(参考訳): BVI-Mamba:低照度・水中環境のための視覚状態空間モデルによる映像強調
- Authors: Guoxi Huang, Ruirui Lin, Yini Li, David R. Bull, Nantheera Anantrasirichai,
- Abstract要約: Visual Mambaは、Visual State Space (VSS)モデルを利用することで、メモリ使用量と計算時間を削減するように設計されている。
Visual Mambaのテクニックは、トランスフォーマーと畳み込みベースのモデルで、低照度と水中のビデオエンハンスメントタスクの両方で優れている。
- 参考スコア(独自算出の注目度): 8.830666229299736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Videos captured in low-light and underwater conditions often suffer from distortions such as noise, low contrast, color imbalance, and blur. These issues not only limit visibility but also degrade automatic tasks like detection. Post-processing is typically required but can be time-consuming. AI-based tools for video enhancement also demand significantly more computational resources compared to image-based methods. This paper introduces a novel framework, Visual Mamba, designed to reduce memory usage and computational time by leveraging the Visual State Space (VSS) model. The framework consists of two modules: (i) a feature alignment module, where spatio-temporal displacement between input frames is registered in the feature space, and (ii) an enhancement module, where noise removal and brightness adjustment are performed using a UNet-like architecture, with all convolutional layers replaced by VSS blocks. Experimental results show that the Visual Mamba technique outperforms Transformer and convolution-based models in both low-light and underwater video enhancement tasks. Code is available on line at https://github.com/russellllaputa/BVI-Mamba.
- Abstract(参考訳): 低照度や水中で撮影されたビデオは、ノイズ、低コントラスト、色の不均衡、ぼやけなどの歪みに悩まされることが多い。
これらの問題は可視性を制限するだけでなく、検出などの自動タスクも低下させる。
後処理は一般的に必要だが、時間を要することがある。
ビデオエンハンスメントのためのAIベースのツールも、画像ベースの方法に比べてはるかに多くの計算リソースを必要としている。
本稿では、Visual State Space(VSS)モデルを利用して、メモリ使用量と計算時間を短縮する新しいフレームワーク、Visual Mambaを紹介する。
フレームワークは2つのモジュールで構成されています。
一 入力フレーム間の時空間変位が特徴空間に登録されている特徴アライメントモジュール
(II)UNetのようなアーキテクチャを用いてノイズ除去と輝度調整を行う拡張モジュールで,すべての畳み込み層をVSSブロックに置き換える。
実験の結果,視覚マンバ法は低照度・水中ビデオ強調作業においてトランスフォーマーと畳み込みに基づくモデルより優れていた。
コードはhttps://github.com/russellllaputa/BVI-Mamba.comで公開されている。
関連論文リスト
- Dynamic Weight-based Temporal Aggregation for Low-light Video Enhancement [6.8703489542630445]
低照度ビデオの強化はノイズ、低コントラスト、色劣化のために困難である。
DWTA-Netは,短期・長期の時間的手がかりを利用した新しいフレームワークである。
DWTA-Netはノイズやアーティファクトを効果的に抑制し、最先端の手法に比べて優れた視覚的品質を提供する。
論文 参考訳(メタデータ) (2025-10-10T15:00:31Z) - Trajectory-aware Shifted State Space Models for Online Video Super-Resolution [57.87099307245989]
本稿では、トラジェクトリ対応シフトSSM(TS-Mamba)に基づく新しいオンラインVSR手法を提案する。
TS-Mambaは、最初にビデオ内の軌跡を構築し、以前のフレームから最もよく似たトークンを選択する。
私たちのTS-Mambaは、ほとんどのケースで最先端のパフォーマンスを実現し、22.7%以上の削減複雑性(MAC)を実現しています。
論文 参考訳(メタデータ) (2025-08-14T08:42:15Z) - STORM: Token-Efficient Long Video Understanding for Multimodal LLMs [116.4479155699528]
STORMは、イメージエンコーダとビデオLLMの間に専用のテンポラリエンコーダを組み込んだ、新しいアーキテクチャである。
我々は,STORMが様々な長いビデオ理解ベンチマークにおいて最先端の結果を達成することを示す。
論文 参考訳(メタデータ) (2025-03-06T06:17:38Z) - Alignment-free Raw Video Demoireing [18.06907326360215]
ビデオの削除は、スクリーンコンテンツのキャプチャ中に発生する望ましくない干渉パターンを取り除くことを目的としている。
本稿では,周波数アシスト型時間的マンバ(DemMamba)を用いたアライメントフリー生ビデオ復調ネットワークを提案する。
PSNRでは、最先端の手法を1.6dB超え、良好な視覚体験を提供する。
論文 参考訳(メタデータ) (2024-08-20T09:31:03Z) - Look-Around Before You Leap: High-Frequency Injected Transformer for Image Restoration [46.96362010335177]
本稿では,画像復元のための簡易かつ効果的な高周波インジェクト変換器HITを提案する。
具体的には,機能マップに高頻度の詳細を組み込んだウィンドウワイドインジェクションモジュール(WIM)を設計し,高品質な画像の復元のための信頼性の高い参照を提供する。
さらに,BIMにおけるチャネル次元の計算によって失われる可能性のある空間的関係を維持するために,空間拡張ユニット(SEU)を導入する。
論文 参考訳(メタデータ) (2024-03-30T08:05:00Z) - Binarized Low-light Raw Video Enhancement [49.65466843856074]
ディープニューラルネットワークは、低照度生ビデオの強化において優れたパフォーマンスを実現している。
本稿では,低照度生ビデオエンハンスメントに超コンパクトなバイナリニューラルネットワーク(BNN)を適用する可能性について検討する。
論文 参考訳(メタデータ) (2024-03-29T02:55:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。