論文の概要: DHFormer: A Vision Transformer-Based Attention Module for Image Dehazing
- arxiv url: http://arxiv.org/abs/2312.09955v1
- Date: Fri, 15 Dec 2023 17:05:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 14:57:19.452536
- Title: DHFormer: A Vision Transformer-Based Attention Module for Image Dehazing
- Title(参考訳): DHFormer:イメージデハージングのためのビジョントランスフォーマーベースのアテンションモジュール
- Authors: Abdul Wasi, O. Jeba Shiney
- Abstract要約: ぼんやりとした条件で取得された画像は、それらによって引き起こされる劣化を生じさせる。
ハウズの効果を緩和し、ヘイズフリーな画像を生成するために、事前ベースおよび学習ベースのアプローチが提案されている。
本稿では,アテンションモジュールにおける残差学習と視覚変換を用いた手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Images acquired in hazy conditions have degradations induced in them.
Dehazing such images is a vexed and ill-posed problem. Scores of prior-based
and learning-based approaches have been proposed to mitigate the effect of haze
and generate haze-free images. Many conventional methods are constrained by
their lack of awareness regarding scene depth and their incapacity to capture
long-range dependencies. In this paper, a method that uses residual learning
and vision transformers in an attention module is proposed. It essentially
comprises two networks: In the first one, the network takes the ratio of a hazy
image and the approximated transmission matrix to estimate a residual map. The
second network takes this residual image as input and passes it through
convolution layers before superposing it on the generated feature maps. It is
then passed through global context and depth-aware transformer encoders to
obtain channel attention. The attention module then infers the spatial
attention map before generating the final haze-free image. Experimental
results, including several quantitative metrics, demonstrate the efficiency and
scalability of the suggested methodology.
- Abstract(参考訳): ぼろぼろの条件で得られた画像は、その中に劣化が引き起こされる。
このようなイメージのデハージングは、悪質で不適切な問題である。
ヘイズの影響を緩和し、ヘイズフリー画像を生成するために、事前ベースおよび学習ベースアプローチのスコアが提案されている。
多くの従来の手法は、シーンの深さと長距離依存を捉える能力の欠如に制約されている。
本稿では,アテンションモジュールにおける残差学習と視覚トランスフォーマを用いた手法を提案する。
これは基本的に2つのネットワークから構成される: 第一に、ネットワークは残留マップを推定するために、ヘイズ画像と近似送信行列の比率を取る。
第2のネットワークは、残像を入力として取り、生成した特徴写像に重ね合わせる前に畳み込み層を通過します。
その後、グローバルコンテキストと深さ認識トランスエンコーダを通過し、チャンネルの注意を引き付ける。
そして、アテンションモジュールは、最終hazeフリー画像を生成する前に、空間アテンションマップを推論する。
いくつかの定量的指標を含む実験結果は、提案手法の効率性とスケーラビリティを実証する。
関連論文リスト
- DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - Unpaired Overwater Image Defogging Using Prior Map Guided CycleGAN [60.257791714663725]
オーバーウォーターシーンで画像をデフォグするための先行マップガイドサイクロン (PG-CycleGAN) を提案する。
提案手法は,最先端の教師付き,半教師付き,非教師付きデグジングアプローチより優れている。
論文 参考訳(メタデータ) (2022-12-23T03:00:28Z) - dual unet:a novel siamese network for change detection with cascade
differential fusion [4.651756476458979]
本稿では,変化検出タスク,すなわちDual-UNetのための新しいSiameseニューラルネットワークを提案する。
従来のバイテンポラル画像の符号化とは対照的に,画素の空間的差分関係に着目したエンコーダ差分アテンションモジュールを設計する。
実験により、提案手法は、一般的な季節変化検出データセットにおいて、常に最も高度な手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-12T14:24:09Z) - Adaptive Image Inpainting [43.02281823557039]
ディープニューラルネットワークを使用することで、塗装法は大幅に改善されている。
この問題は、欠落した領域の完全かつ忠実な埋め込みを構築する際のエンコーダ層の非効率性に根ざしている。
本稿では, エンコーダ層に対して, 直接的特徴レベルの監視を行う蒸留方式を提案する。
論文 参考訳(メタデータ) (2022-01-01T12:16:01Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - Single image dehazing via combining the prior knowledge and CNNs [6.566615606042994]
本稿では,従来の知識と深層学習を組み合わせることで,欠陥の低減を図るために,エンドツーエンドシステムを提案する。
実験により,提案手法は既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-10T14:18:25Z) - Non-Homogeneous Haze Removal via Artificial Scene Prior and
Bidimensional Graph Reasoning [52.07698484363237]
本研究では,人工シーンの前置と2次元グラフ推論による不均質なヘイズ除去ネットワーク(nhrn)を提案する。
本手法は,単一画像デハジングタスクとハイザイ画像理解タスクの両方において,最先端アルゴリズムよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2021-04-05T13:04:44Z) - Gated Fusion Network for Degraded Image Super Resolution [78.67168802945069]
本稿では,基本特徴と回復特徴を別々に抽出する二分岐畳み込みニューラルネットワークを提案する。
特徴抽出ステップを2つのタスク非依存ストリームに分解することで、デュアルブランチモデルがトレーニングプロセスを容易にすることができる。
論文 参考訳(メタデータ) (2020-03-02T13:28:32Z) - Class-Specific Blind Deconvolutional Phase Retrieval Under a Generative
Prior [8.712404218757733]
この問題はフーリエ・プチコグラフィー、X線結晶学、可視光通信など様々な画像モダリティで発生する。
本稿では,事前訓練された2つの深層生成ネットワークの下での交互勾配降下アルゴリズムを用いて,この逆問題の解法を提案する。
提案アルゴリズムは,前向き測定モデルを説明する各前駆体の範囲内で,シャープな画像とぼやけたカーネルを見つけ出そうとする。
論文 参考訳(メタデータ) (2020-02-28T07:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。