論文の概要: Orthogonal Transform based Generative Adversarial Network for Image
Dehazing
- arxiv url: http://arxiv.org/abs/2206.01743v1
- Date: Fri, 3 Jun 2022 08:17:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-07 15:20:01.984864
- Title: Orthogonal Transform based Generative Adversarial Network for Image
Dehazing
- Title(参考訳): 画像デハジングのための直交変換に基づく生成逆ネットワーク
- Authors: Ahlad Kumar, Mantra Sanathra, Manish Khare, and Vijeta Khare
- Abstract要約: そこで本研究では,Krawtchouk変換領域のデハズド画像を直接推定する,新しいエンドツーエンドアーキテクチャを提案する。
画像の低周波に主にヘイズが存在することが観察されており、クローチョーク変換は画像の高周波と低周波を別々に解析するのに役立つ。
- 参考スコア(独自算出の注目度): 5.720413162711827
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image dehazing has become one of the crucial preprocessing steps for any
computer vision task. Most of the dehazing methods try to estimate the
transmission map along with the atmospheric light to get the dehazed image in
the image domain. In this paper, we propose a novel end-to-end architecture
that directly estimates dehazed image in Krawtchouk transform domain. For this
a customized Krawtchouk Convolution Layer (KCL) in the architecture is added.
KCL is constructed using Krawtchouk basis functions which converts the image
from the spatial domain to the Krawtchouk transform domain. Another convolution
layer is added at the end of the architecture named as Inverse Krawtchouk
Convolution Layer (IKCL) which converts the image back to the spatial domain
from the transform domain. It has been observed that the haze is mainly present
in lower frequencies of hazy images, wherein the Krawtchouk transform helps to
analyze the high and low frequencies of the images separately. We have divided
our architecture into two branches, the upper branch deals with the higher
frequencies while the lower branch deals with the lower frequencies of the
image. The lower branch is made deeper in terms of the layers as compared to
the upper branch to address the haze present in the lower frequencies. Using
the proposed Orthogonal Transform based Generative Adversarial Network (OTGAN)
architecture for image dehazing, we were able to achieve competitive results
when compared to the present state-of-the-art methods.
- Abstract(参考訳): 画像デハジングは、あらゆるコンピュータビジョンタスクにおいて重要な前処理ステップの1つとなっている。
ほとんどのデハジング手法は、大気光とともに送信マップを推定し、デハジングされた画像を画像領域に取得しようとする。
本稿では,Krawtchouk変換領域におけるデハズ画像を直接推定する,新しいエンドツーエンドアーキテクチャを提案する。
これにより、アーキテクチャにカスタマイズされたKrawtchouk Convolution Layer (KCL)が追加される。
kclは、空間領域からkrawtchouk変換領域へ画像を変換するkrawtchouk基底関数を用いて構築される。
もう一つの畳み込み層は逆クラチョーク畳み込み層 (inverse krawtchouk convolution layer,ikcl) と呼ばれるアーキテクチャの最後に付加され、画像は変換領域から空間領域に変換される。
hazeは主にhazy画像の低周波に存在し、krawtchouk変換は画像の高周波と低周波を別々に解析するのに役立つことが観測されている。
アーキテクチャを2つのブランチに分割し、上位ブランチは高周波数を扱い、下位ブランチは低周波数を扱っています。
下位の分岐は、下位の周波数に存在するヘイズに対処するため、上位の分岐と比較して層の観点からより深くなされる。
画像デハジングのための直交変換に基づく生成逆ネットワーク (otgan) アーキテクチャを用いて, 現状の手法と比較して, 競合する結果を得ることができた。
関連論文リスト
- Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - xAI-CycleGAN, a Cycle-Consistent Generative Assistive Network [0.0]
CycleGANは画像から画像への変換に適したアーキテクチャとなっている。
本研究では,判別器による説明可能性を用いて生成モデルの収束速度を高速化する。
この新しいアーキテクチャは、ベースラインのCycleGANアーキテクチャよりもはるかに高い収束率を持つ。
論文 参考訳(メタデータ) (2023-06-27T19:26:28Z) - DPFNet: A Dual-branch Dilated Network with Phase-aware Fourier
Convolution for Low-light Image Enhancement [1.2645663389012574]
低照度画像の高精細化は、低照度画像から通常の露光画像を復元することを目的とした古典的なコンピュータビジョン問題である。
この分野でよく使われる畳み込みニューラルネットワークは、空間領域の低周波局所構造の特徴をサンプリングするのに長けている。
周波数位相のセマンティクスの制約の下で高品質なテクスチャの詳細を復元できるフーリエ係数を用いた新しいモジュールを提案する。
論文 参考訳(メタデータ) (2022-09-16T13:56:09Z) - Riesz-Quincunx-UNet Variational Auto-Encoder for Satellite Image
Denoising [0.0]
衛星画像のノイズ低減に使用される画像および時系列分解のためのハイブリッドRQUNet-VAE方式を提案する。
また,本手法をマルチバンド衛星画像に適用し,画像の分解,画像分割,拡散による時系列分解,画像分割などを行う。
論文 参考訳(メタデータ) (2022-08-25T19:51:07Z) - Cross-Modality High-Frequency Transformer for MR Image Super-Resolution [100.50972513285598]
我々はTransformerベースのMR画像超解像フレームワークを構築するための初期の取り組みを構築した。
我々は、高周波構造とモード間コンテキストを含む2つの領域先行について考察する。
我々は,Cross-modality High- frequency Transformer (Cohf-T)と呼ばれる新しいTransformerアーキテクチャを構築し,低解像度画像の超解像化を実現する。
論文 参考訳(メタデータ) (2022-03-29T07:56:55Z) - Spatially-Adaptive Image Restoration using Distortion-Guided Networks [51.89245800461537]
空間的に変化する劣化に苦しむ画像の復元のための学習ベースソリューションを提案する。
本研究では、歪み局所化情報を活用し、画像中の困難な領域に動的に適応するネットワーク設計であるSPAIRを提案する。
論文 参考訳(メタデータ) (2021-08-19T11:02:25Z) - TWIST-GAN: Towards Wavelet Transform and Transferred GAN for
Spatio-Temporal Single Image Super Resolution [4.622977798361014]
単一画像スーパーレゾリューション(sisr)は、空間解像度の低いリモートセンシング画像から、微細な空間解像度を持つ高解像度画像を生成する。
深層学習とGAN(Generative Adversarial Network)は、単一画像超解像(SISR)の課題を突破した。
論文 参考訳(メタデータ) (2021-04-20T22:12:38Z) - Image-to-image Mapping with Many Domains by Sparse Attribute Transfer [71.28847881318013]
教師なし画像と画像の変換は、2つの領域間の一対のマッピングを、ポイント間の既知のペアワイズ対応なしで学習することで構成される。
現在の慣例は、サイクル一貫性のあるGANでこのタスクにアプローチすることです。
そこで本研究では,ジェネレータを直接,潜在層における単純なスパース変換に制限する代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-23T19:52:23Z) - Domain Adaptation for Image Dehazing [72.15994735131835]
既存のほとんどの方法は、合成ヘイズ画像のデハージングモデルを訓練するが、ドメインシフトによる実際のヘイズ画像の一般化は困難である。
画像変換モジュールと2つの画像デハージングモジュールからなるドメイン適応パラダイムを提案する。
実世界の合成画像と実世界の画像の両方で実験結果から,我々のモデルは最先端の脱ハージングアルゴリズムに対して好適に機能することが示された。
論文 参考訳(メタデータ) (2020-05-10T13:54:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。