論文の概要: WaveletFormerNet: A Transformer-based Wavelet Network for Real-world
Non-homogeneous and Dense Fog Removal
- arxiv url: http://arxiv.org/abs/2401.04550v1
- Date: Tue, 9 Jan 2024 13:42:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 15:33:42.511409
- Title: WaveletFormerNet: A Transformer-based Wavelet Network for Real-world
Non-homogeneous and Dense Fog Removal
- Title(参考訳): WaveletFormerNet: 現実世界の非均一・高密度フォッグ除去のためのトランスフォーマーベースウェーブレットネットワーク
- Authors: Shengli Zhang, Zhiyong Tao, and Sen Lin
- Abstract要約: 本稿では,現実の霧画像回復のためのトランスフォーマーベースのウェーブレットネットワーク(WaveletFormerNet)を提案する。
トランスフォーマーブロックに並列畳み込みを導入し、軽量な機構で多周波情報のキャプチャを可能にする。
我々の実験は、WaveletFormerNetが最先端の手法よりも優れていることを示した。
- 参考スコア(独自算出の注目度): 11.757602977709517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although deep convolutional neural networks have achieved remarkable success
in removing synthetic fog, it is essential to be able to process images taken
in complex foggy conditions, such as dense or non-homogeneous fog, in the real
world. However, the haze distribution in the real world is complex, and
downsampling can lead to color distortion or loss of detail in the output
results as the resolution of a feature map or image resolution decreases. In
addition to the challenges of obtaining sufficient training data, overfitting
can also arise in deep learning techniques for foggy image processing, which
can limit the generalization abilities of the model, posing challenges for its
practical applications in real-world scenarios. Considering these issues, this
paper proposes a Transformer-based wavelet network (WaveletFormerNet) for
real-world foggy image recovery. We embed the discrete wavelet transform into
the Vision Transformer by proposing the WaveletFormer and IWaveletFormer
blocks, aiming to alleviate texture detail loss and color distortion in the
image due to downsampling. We introduce parallel convolution in the Transformer
block, which allows for the capture of multi-frequency information in a
lightweight mechanism. Additionally, we have implemented a feature aggregation
module (FAM) to maintain image resolution and enhance the feature extraction
capacity of our model, further contributing to its impressive performance in
real-world foggy image recovery tasks. Extensive experiments demonstrate that
our WaveletFormerNet performs better than state-of-the-art methods, as shown
through quantitative and qualitative evaluations of minor model complexity.
Additionally, our satisfactory results on real-world dust removal and
application tests showcase the superior generalization ability and improved
performance of WaveletFormerNet in computer vision-related applications.
- Abstract(参考訳): 深い畳み込みニューラルネットワークは合成霧の除去に著しく成功したが、実世界で密度の高い霧や非均質な霧などの複雑な霧条件で撮影された画像を処理できることは不可欠である。
しかし、実世界のヘイズ分布は複雑であり、ダウンサンプリングは特徴マップの解像度や画像の解像度が低下するにつれて、出力結果の色歪みや詳細の損失につながる可能性がある。
十分なトレーニングデータを取得することの難しさに加えて、オーバーフィッティングは霧のような画像処理のためのディープラーニング技術にも生じ、これはモデルの一般化能力を制限し、現実のシナリオにおける実用上の課題を提起する。
そこで本稿では,実世界のフォギー画像復元のためのトランスフォーマーベースのウェーブレットネットワーク (waveletformernet) を提案する。
離散ウェーブレット変換を、ウェーブレットフォーマおよびiウェーブレットフォーマブロックの提案により視覚トランスフォーマに組み込むことにより、ダウンサンプリングによる画像のテクスチャディテールロスと色歪みの軽減を図る。
並列畳み込みをトランスフォーマーブロックに導入し、軽量な機構でマルチ周波数情報のキャプチャを可能にする。
さらに,画像の解像度を維持し,特徴抽出能力を向上させる機能集約モジュール(FAM)を実装した。
広範な実験により、waveletformernetは、小さなモデルの複雑さの定量的および質的評価によって示されるように、最先端の手法よりも優れた性能を示している。
さらに,実世界のほこり除去とアプリケーションテストの満足度は,コンピュータビジョン関連アプリケーションにおけるWaveletFormerNetの優れた一般化能力と性能の向上を示す。
関連論文リスト
- Efficient Face Super-Resolution via Wavelet-based Feature Enhancement Network [27.902725520665133]
顔超解像は、低解像度の顔画像から高解像度の顔画像を再構成することを目的としている。
以前は、顔の構造的特徴を抽出するためにエンコーダ・デコーダ構造を用いていた。
本稿では,ウェーブレットに基づく特徴拡張ネットワークを提案する。このネットワークは,入力特徴を高周波数成分と低周波数成分に無作為に分解することで,特徴歪みを軽減する。
論文 参考訳(メタデータ) (2024-07-29T08:03:33Z) - Training Transformer Models by Wavelet Losses Improves Quantitative and Visual Performance in Single Image Super-Resolution [6.367865391518726]
トランスフォーマーベースモデルは、画像超解像(SR)を含む低レベル視覚タスクにおいて顕著な結果を得た
グローバルにより多くの入力ピクセルを活性化するために、ハイブリッドアテンションモデルが提案されている。
ウェーブレット損失を利用してTransformerモデルをトレーニングし、定量的および主観的性能を向上させる。
論文 参考訳(メタデータ) (2024-04-17T11:25:19Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Physics-Driven Turbulence Image Restoration with Stochastic Refinement [80.79900297089176]
大気乱流による画像歪みは、長距離光学画像システムにおいて重要な問題である。
ディープラーニングモデルが現実世界の乱流条件に適応するために、高速で物理学的なシミュレーションツールが導入された。
本稿では,物理統合復元ネットワーク(PiRN)を提案する。
論文 参考訳(メタデータ) (2023-07-20T05:49:21Z) - Efficient Textured Mesh Recovery from Multiple Views with Differentiable
Rendering [8.264851594332677]
マルチビュー画像からテクスチャメッシュを復元する手法を提案する。
学習ベース多視点ステレオアルゴリズムにより予測される深度との差を最小化することにより形状形状を最適化する。
形状や色に対する暗黙的なニューラル表現とは対照的に,物体の光と反射を共同で推定する物理ベース逆レンダリング方式を導入する。
論文 参考訳(メタデータ) (2022-05-25T03:33:55Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - SDWNet: A Straight Dilated Network with Wavelet Transformation for Image
Deblurring [23.86692375792203]
画像劣化は、ぼやけた画像から鋭い画像を復元することを目的としたコンピュータビジョンの問題である。
我々のモデルは拡張畳み込みを用いて空間分解能の高い大きな受容場を得ることができる。
本稿では,ウェーブレット変換を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2021-10-12T07:58:10Z) - Wavelet Channel Attention Module with a Fusion Network for Single Image
Deraining [46.62290347397139]
雨が画像の視界を著しく悪化させるため、単一画像のデライン化は重要な問題である。
融合ネットワークを用いたウェーブレットチャネルアテンションモジュールと呼ばれる新しい畳み込みニューラルネットワーク(CNN)を提案する。
論文 参考訳(メタデータ) (2020-07-17T18:06:13Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。