論文の概要: Harnessing Multi-resolution and Multi-scale Attention for Underwater Image Restoration
- arxiv url: http://arxiv.org/abs/2408.09912v1
- Date: Mon, 19 Aug 2024 11:36:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-20 16:35:11.003096
- Title: Harnessing Multi-resolution and Multi-scale Attention for Underwater Image Restoration
- Title(参考訳): 水中画像復元のためのマルチレゾリューションとマルチスケールアテンション
- Authors: Alik Pramanick, Arijit Sur, V. Vijaya Saradhi,
- Abstract要約: 最近の水中画像復元法では、入力画像をフル解像度で分析するか、高解像度から低解像度に段階的に分析し、信頼性の高い意味情報を出力するが、空間精度は低下する。
本稿では,マルチレゾリューションとマルチスケールの画像解析に焦点を当てた,軽量なマルチステージネットワークLit-Netを提案する。
我々の新しいエンコーダブロックは、並列な1時間1ドルの畳み込みレイヤを使用して、ローカル情報をキャプチャし、操作を高速化する。
- 参考スコア(独自算出の注目度): 3.686808512438363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Underwater imagery is often compromised by factors such as color distortion and low contrast, posing challenges for high-level vision tasks. Recent underwater image restoration (UIR) methods either analyze the input image at full resolution, resulting in spatial richness but contextual weakness, or progressively from high to low resolution, yielding reliable semantic information but reduced spatial accuracy. Here, we propose a lightweight multi-stage network called Lit-Net that focuses on multi-resolution and multi-scale image analysis for restoring underwater images while retaining original resolution during the first stage, refining features in the second, and focusing on reconstruction in the final stage. Our novel encoder block utilizes parallel $1\times1$ convolution layers to capture local information and speed up operations. Further, we incorporate a modified weighted color channel-specific $l_1$ loss ($cl_1$) function to recover color and detail information. Extensive experimentations on publicly available datasets suggest our model's superiority over recent state-of-the-art methods, with significant improvement in qualitative and quantitative measures, such as $29.477$ dB PSNR ($1.92\%$ improvement) and $0.851$ SSIM ($2.87\%$ improvement) on the EUVP dataset. The contributions of Lit-Net offer a more robust approach to underwater image enhancement and super-resolution, which is of considerable importance for underwater autonomous vehicles and surveillance. The code is available at: https://github.com/Alik033/Lit-Net.
- Abstract(参考訳): 水中画像は、色歪みや低コントラストなどの要因によってしばしば損なわれ、ハイレベルな視覚タスクの課題を提起する。
近年の水中画像復元法 (UIR) では、入力画像を全解像度で解析し、空間的豊かさと文脈的弱さを生じるか、高解像度から低解像度に段階的に改善し、信頼性の高いセマンティック情報を得るが、空間的精度は低下する。
本稿では,Lit-Netと呼ばれる軽量なマルチステージネットワークを提案し,第1段の解像度を維持しつつ,第2段の解像度を維持しつつ,最終段の解像度に焦点をあてたマルチ解像度・マルチスケール画像解析を行う。
我々の新しいエンコーダブロックは、並列な$1\times1$の畳み込みレイヤを使用して、ローカル情報をキャプチャし、操作を高速化する。
さらに、色と詳細情報を復元するために、色チャンネル固有の$l_1$ loss(cl_1$)関数を修正した。
一般公開されたデータセットに対する大規模な実験は、我々のモデルが最近の最先端の手法よりも優れていることを示唆しており、EUVPデータセットにおける29.477$dB PSNR(1.92.%)や0.851$SSIM(2.87.%)といった質的かつ定量的な尺度が大幅に改善されている。
Lit-Netの貢献により、水中画像の強化と超高解像度化に対するより堅牢なアプローチが提供される。
コードは、https://github.com/Alik033/Lit-Net.comで入手できる。
関連論文リスト
- Learning Weighting Map for Bit-Depth Expansion within a Rational Range [64.15915577164894]
ビット深化(BDE)は、低ビット深化(LBD)ソースから高ビット深化(HBD)画像を表示する新興技術の1つである。
既存のBDEメソッドは、様々なBDE状況に対して統一的なソリューションを持っていない。
我々は,各画素の重みを求めるためにビット復元ネットワーク(BRNet)を設計し,補充値の比率を合理的範囲内で示す。
論文 参考訳(メタデータ) (2022-04-26T02:27:39Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Wavelength-based Attributed Deep Neural Network for Underwater Image
Restoration [9.378355457555319]
本稿では,色チャネルの移動範囲に基づいて,適切な受容場サイズ(コンテキスト)を付与することで,大幅な性能向上が期待できることを示す。
第2の新規性として、学習したマルチコンテキスト特徴を適応的に洗練するための注意的スキップ機構を組み込んだ。
提案するフレームワークはDeep WaveNetと呼ばれ、従来のピクセル単位で機能ベースのコスト関数を使って最適化されている。
論文 参考訳(メタデータ) (2021-06-15T06:47:51Z) - Degrade is Upgrade: Learning Degradation for Low-light Image Enhancement [52.49231695707198]
2段階の工程で細部と色を精錬しながら、内在的な劣化と低照度画像を照らし出す。
カラー画像の定式化に触発されて,まず低照度入力からの劣化を推定し,環境照明色の歪みをシミュレーションし,そのコンテンツを精錬して拡散照明色の損失を回復した。
LOL1000データセットではPSNRで0.95dB、ExDarkデータセットでは3.18%のmAPでSOTAを上回った。
論文 参考訳(メタデータ) (2021-03-19T04:00:27Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Contextual Residual Aggregation for Ultra High-Resolution Image
Inpainting [12.839962012888199]
そこで本稿では,CRA(Contextual Residual Aggregation)機構を提案する。
CRA機構は、コンテキストパッチからの残基の重み付けにより、欠落した内容に対して高周波残基を生成する。
提案手法は,解像度512×512の小型画像に対して学習し,高解像度画像に対する推論を行い,良好な塗装品質を実現する。
論文 参考訳(メタデータ) (2020-05-19T18:55:32Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。