論文の概要: SFormer: SNR-guided Transformer for Underwater Image Enhancement from the Frequency Domain
- arxiv url: http://arxiv.org/abs/2508.18664v1
- Date: Tue, 26 Aug 2025 04:10:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.675482
- Title: SFormer: SNR-guided Transformer for Underwater Image Enhancement from the Frequency Domain
- Title(参考訳): SFormer: 周波数領域からの水中画像強調のためのSNR誘導変圧器
- Authors: Xin Tian, Yingtie Lei, Xiujun Zhang, Zimeng Li, Chi-Man Pun, Xuhang Chen,
- Abstract要約: 近年の学習に基づく水中画像強調法 (UIE) は, 深層ニューラルネットワークに物理先行情報を組み込むことによって進歩している。
本稿では、周波数領域に先行する信号対雑音比を用いて、特性を振幅スペクトルと位相スペクトルに分解し、チャネル変調を改善することを提案する。
UIEB、EUVP、LSUIから4,800枚のペアイメージをトレーニングし、SFormerはPSNRで3.1dB、SSIMで0.08dB、水中シーンで色、テクスチャ、コントラストの復元に成功した。
- 参考スコア(独自算出の注目度): 32.62223991134511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent learning-based underwater image enhancement (UIE) methods have advanced by incorporating physical priors into deep neural networks, particularly using the signal-to-noise ratio (SNR) prior to reduce wavelength-dependent attenuation. However, spatial domain SNR priors have two limitations: (i) they cannot effectively separate cross-channel interference, and (ii) they provide limited help in amplifying informative structures while suppressing noise. To overcome these, we propose using the SNR prior in the frequency domain, decomposing features into amplitude and phase spectra for better channel modulation. We introduce the Fourier Attention SNR-prior Transformer (FAST), combining spectral interactions with SNR cues to highlight key spectral components. Additionally, the Frequency Adaptive Transformer (FAT) bottleneck merges low- and high-frequency branches using a gated attention mechanism to enhance perceptual quality. Embedded in a unified U-shaped architecture, these modules integrate a conventional RGB stream with an SNR-guided branch, forming SFormer. Trained on 4,800 paired images from UIEB, EUVP, and LSUI, SFormer surpasses recent methods with a 3.1 dB gain in PSNR and 0.08 in SSIM, successfully restoring colors, textures, and contrast in underwater scenes.
- Abstract(参考訳): 近年の学習に基づく水中画像強調法 (UIE) は、特に波長依存減衰の低減に先立って信号-雑音比 (SNR) を用いて、深層ニューラルネットワークに物理先行を組み込むことによって進歩している。
しかし、空間領域SNRプリエントには2つの制限がある。
(i)チャンネル間干渉を効果的に分離することができず、
(二)騒音を抑えつつ情報構造を増幅する際、限られた助けを提供する。
これらを克服するため,周波数領域におけるSNRを用いて,より優れたチャネル変調のための振幅スペクトルと位相スペクトルに分解する手法を提案する。
本稿では,Fourier Attention SNR-prior Transformer(FAST)について紹介する。
さらに、周波数適応変換器(FAT)ボトルネックは、ゲートアテンション機構を用いて低周波および高周波の分岐をマージし、知覚品質を高める。
これらのモジュールは統一されたU字型アーキテクチャに埋め込まれ、従来のRGBストリームとSNR誘導ブランチを統合し、SFormerを形成する。
UIEB、EUVP、LSUIから4,800枚のペア画像で訓練されたSFormerは、PSNRで3.1dB、SSIMで0.08dB、水中のシーンで色、テクスチャ、コントラストの復元に成功している。
関連論文リスト
- FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - snnTrans-DHZ: A Lightweight Spiking Neural Network Architecture for Underwater Image Dehazing [6.780557477791034]
本稿では,水中脱ハージング用に設計された軽量スパイキングニューラルネットワーク(SNN)であるsnnTrans-DHZを紹介する。
i)複数の色空間表現から特徴を抽出するK推定器、(ii)RGB-LAB画像から背景光成分を共同で推論するバックグラウンド光エステータ、(iii)ヘイズフリーで可視性のある出力を生成するソフト画像再構成モジュールである。
論文 参考訳(メタデータ) (2025-04-13T19:03:33Z) - FUSION: Frequency-guided Underwater Spatial Image recOnstructioN [0.0]
水中画像は、色歪み、可視性低下、波長依存性の減衰と散乱による構造的詳細の喪失など、深刻な劣化に悩まされている。
既存の拡張手法は主に空間領域処理に重点を置いており、グローバルな色分布と長距離依存を捉える周波数領域の可能性を無視している。
本稿では,空間領域情報と周波数領域情報を併用した2領域深層学習フレームワーク「フュージョン」を提案する。
論文 参考訳(メタデータ) (2025-04-01T23:16:19Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Rethinking Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師付き画像復調(SSID)におけるニューラルネットワークアーキテクチャとして広く使われている。
本研究では,Transformer ベースの Blind-Spot Network (TBSN) を構築した。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - Hyperspectral Image Denoising via Self-Modulating Convolutional Neural
Networks [15.700048595212051]
相関スペクトルと空間情報を利用した自己変調畳み込みニューラルネットワークを提案する。
モデルの中心には新しいブロックがあり、隣り合うスペクトルデータに基づいて、ネットワークが適応的に特徴を変換することができる。
合成データと実データの両方の実験解析により,提案したSM-CNNは,他の最先端HSI復調法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-09-15T06:57:43Z) - Low-Light Enhancement in the Frequency Domain [24.195131201768096]
低照度画像には、可視性、高密度ノイズ、偏光色がよく見られる。
周波数領域で学習した新しい残差多重ウェーブレット畳み込みニューラルネットワークR2-MWCNNを提案する。
このエンドツーエンドのトレーニング可能なネットワークは、マルチレベル離散ウェーブレット変換を使用して入力特徴写像を異なる周波数に分割し、より優れたノイズの影響をもたらす。
論文 参考訳(メタデータ) (2023-06-29T08:39:34Z) - Multi-stage image denoising with the wavelet transform [125.2251438120701]
深部畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、正確な構造情報を自動マイニングすることで、画像の復調に使用される。
動的畳み込みブロック(DCB)、2つのカスケードウェーブレット変換および拡張ブロック(WEB)、残留ブロック(RB)の3段階を経由した、MWDCNNによるCNNの多段階化を提案する。
論文 参考訳(メタデータ) (2022-09-26T03:28:23Z) - Deep Denoising Neural Network Assisted Compressive Channel Estimation
for mmWave Intelligent Reflecting Surfaces [99.34306447202546]
本稿では,mmWave IRSシステムに対するディープデノイングニューラルネットワークを用いた圧縮チャネル推定法を提案する。
我々はまず、受信チェーンをほとんど使わず、アップリンクのユーザ-IRSチャネルを推定するハイブリッド・パッシブ/アクティブIRSアーキテクチャを導入する。
完全チャネル行列は、圧縮センシングに基づいて限られた測定値から再構成することができる。
論文 参考訳(メタデータ) (2020-06-03T12:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。