論文の概要: URWKV: Unified RWKV Model with Multi-state Perspective for Low-light Image Restoration
- arxiv url: http://arxiv.org/abs/2505.23068v1
- Date: Thu, 29 May 2025 04:17:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.673229
- Title: URWKV: Unified RWKV Model with Multi-state Perspective for Low-light Image Restoration
- Title(参考訳): URWKV:低照度画像復元のための多状態視点付き統一RWKVモデル
- Authors: Rui Xu, Yuzhen Niu, Yuezhou Li, Huangbiao Xu, Wenxi Liu, Yuzhong Chen,
- Abstract要約: 多状態視点を用いた統一受容重み付き鍵値(URWKV)モデルを提案する。
URWKVブロックのコアをカスタマイズし、複数のステージ内およびステージ間状態を利用して複雑な劣化を認識・解析する。
最先端モデルと比較して、URWKVモデルは様々なベンチマークにおいて優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 22.746234919635018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing low-light image enhancement (LLIE) and joint LLIE and deblurring (LLIE-deblur) models have made strides in addressing predefined degradations, yet they are often constrained by dynamically coupled degradations. To address these challenges, we introduce a Unified Receptance Weighted Key Value (URWKV) model with multi-state perspective, enabling flexible and effective degradation restoration for low-light images. Specifically, we customize the core URWKV block to perceive and analyze complex degradations by leveraging multiple intra- and inter-stage states. First, inspired by the pupil mechanism in the human visual system, we propose Luminance-adaptive Normalization (LAN) that adjusts normalization parameters based on rich inter-stage states, allowing for adaptive, scene-aware luminance modulation. Second, we aggregate multiple intra-stage states through exponential moving average approach, effectively capturing subtle variations while mitigating information loss inherent in the single-state mechanism. To reduce the degradation effects commonly associated with conventional skip connections, we propose the State-aware Selective Fusion (SSF) module, which dynamically aligns and integrates multi-state features across encoder stages, selectively fusing contextual information. In comparison to state-of-the-art models, our URWKV model achieves superior performance on various benchmarks, while requiring significantly fewer parameters and computational resources.
- Abstract(参考訳): 既存のLow-light Image enhancement (LLIE) とジョイントLLIEとDeblurring (LLIE-deblur) モデルでは、事前に定義された劣化に対処する努力が続けられているが、動的に結合された劣化によって制約されることが多い。
これらの課題に対処するために、低照度画像のフレキシブルかつ効率的な劣化回復を可能にする、多状態視点による統一受容重み付き鍵値(URWKV)モデルを導入する。
具体的には、コアURWKVブロックをカスタマイズし、複数のステージ内およびステージ間状態を利用して複雑な劣化を認識・解析する。
まず,人間の視覚系における瞳孔機構に着想を得たLuminance-Adaptive Normalization(LAN)を提案する。
第2に、指数移動平均法により複数の段階内状態を集約し、単一状態機構に固有の情報損失を軽減しつつ、微妙な変動を効果的に捉えた。
本研究では,従来のスキップ接続に共通する劣化効果を低減するために,エンコーダのステージ間で動的に複数状態の特徴を整列して統合し,コンテキスト情報を選択的に融合するState-Aware Selective Fusion (SSF)モジュールを提案する。
最先端モデルと比較して、URWKVモデルは、パラメータや計算資源を著しく少なくしながら、様々なベンチマークにおいて優れた性能を発揮する。
関連論文リスト
- Manifold-aware Representation Learning for Degradation-agnostic Image Restoration [135.90908995927194]
画像復元(IR)は、ノイズ、ぼかし、迷路、雨、低照度といった様々な汚職に影響を受ける劣化した入力から高品質な画像を復元することを目的としている。
我々は、入力特徴空間を3つのセマンティックに整列した並列分岐に明示的に分解する1つのIRにおいて、すべてに統一されたフレームワークであるMIRAGEを提案する。
このモジュラ分解は、多種多様な分解の一般化と効率を大幅に改善する。
論文 参考訳(メタデータ) (2025-05-24T12:52:10Z) - Any Image Restoration via Efficient Spatial-Frequency Degradation Adaptation [158.37640586809187]
劣化した画像を1つのモデルで効率的に復元することは、ますます重要になっている。
我々のアプローチはAnyIRと呼ばれ、様々な劣化にまたがる固有の類似性を活用する統一された経路をとっています。
劣化認識と文脈的注意を融合させるため,空間周波数並列融合戦略を提案する。
論文 参考訳(メタデータ) (2025-04-19T09:54:46Z) - VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression [59.14355576912495]
NeRFベースのビデオは、FVV(Photorealistic Free-Viewpoint Video)体験を提供することによって、ビジュアルメディアに革命をもたらした。
大量のデータボリュームは、ストレージと送信に重大な課題をもたらす。
ビデオ圧縮のための新しいエンドツーエンドの可変レートフレームワークであるVRVVCを提案する。
論文 参考訳(メタデータ) (2024-12-16T01:28:04Z) - Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.57487747508179]
マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:26:34Z) - Content-decoupled Contrastive Learning-based Implicit Degradation Modeling for Blind Image Super-Resolution [33.16889233975723]
急激な劣化モデルに基づくブラインド・スーパーレゾリューション(SR)は、コミュニティで注目を集めている。
本稿では,CdCL(Content-decoupled Contrastive Learning-based blind image super- resolution)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-10T04:51:43Z) - Low-Light Video Enhancement via Spatial-Temporal Consistent Decomposition [52.89441679581216]
低照度ビデオエンハンスメント(LLVE)は、激しい視認性とノイズに悩まされる動的または静的なシーンの復元を目指している。
本稿では、ビューに依存しない、ビューに依存しないコンポーネントを組み込んだ革新的なビデオ分解戦略を提案する。
我々のフレームワークは、既存のメソッドを一貫して上回り、新しいSOTAパフォーマンスを確立します。
論文 参考訳(メタデータ) (2024-05-24T15:56:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。