Fugu-MT 論文翻訳(概要): Mutual Information-driven Triple Interaction Network for Efficient Image Dehazing

論文の概要: Mutual Information-driven Triple Interaction Network for Efficient Image Dehazing

arxiv url: http://arxiv.org/abs/2308.06998v1
Date: Mon, 14 Aug 2023 08:23:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-15 13:56:19.883237
Title: Mutual Information-driven Triple Interaction Network for Efficient Image Dehazing
Title（参考訳）: 効率的な画像デハジングのための相互情報駆動型トリプルインタラクションネットワーク
Authors: Hao Shen, Zhong-Qiu Zhao, Yulun Zhang, Zhao Zhang
Abstract要約: 画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
参考スコア（独自算出の注目度）: 54.168567276280505
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-stage architectures have exhibited efficacy in image dehazing, which usually decomposes a challenging task into multiple more tractable sub-tasks and progressively estimates latent hazy-free images. Despite the remarkable progress, existing methods still suffer from the following shortcomings: (1) limited exploration of frequency domain information; (2) insufficient information interaction; (3) severe feature redundancy. To remedy these issues, we propose a novel Mutual Information-driven Triple interaction Network (MITNet) based on spatial-frequency dual domain information and two-stage architecture. To be specific, the first stage, named amplitude-guided haze removal, aims to recover the amplitude spectrum of the hazy images for haze removal. And the second stage, named phase-guided structure refined, devotes to learning the transformation and refinement of the phase spectrum. To facilitate the information exchange between two stages, an Adaptive Triple Interaction Module (ATIM) is developed to simultaneously aggregate cross-domain, cross-scale, and cross-stage features, where the fused features are further used to generate content-adaptive dynamic filters so that applying them to enhance global context representation. In addition, we impose the mutual information minimization constraint on paired scale encoder and decoder features from both stages. Such an operation can effectively reduce information redundancy and enhance cross-stage feature complementarity. Extensive experiments on multiple public datasets exhibit that our MITNet performs superior performance with lower model complexity.The code and models are available at https://github.com/it-hao/MITNet.
Abstract（参考訳）: マルチステージアーキテクチャは画像デハジングにおいて有効性を示しており、通常は困難なタスクをより扱いやすいサブタスクに分解し、潜在的なハジンフリー画像を段階的に見積もる。顕著な進歩にもかかわらず、既存の手法は、(1)周波数領域情報の限られた探索、(2)情報相互作用の不足、(3)深刻な特徴冗長性、という欠点に苦しめられている。そこで本稿では,空間周波数デュアルドメイン情報と2段階アーキテクチャに基づく情報駆動型トリプルインタラクションネットワーク(mitnet)を提案する。具体的には、振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。そして、位相誘導構造と呼ばれる第2段階は、位相スペクトルの変換と微細化を学ぶことに熱心である。 2段階間の情報交換を容易にするため、アダプティブ・トリプル・インタラクション・モジュール(ATIM)が開発され、クロスドメイン、クロススケール、クロスステージの機能を同時に集約する。さらに,両段からペア化スケールエンコーダとデコーダ機能に対して,相互情報最小化制約を課す。このような操作は、情報冗長性を効果的に低減し、段間特徴相補性を高める。複数の公開データセットに関する大規模な実験によると、私たちのMITNetは、より低いモデルの複雑さで優れたパフォーマンスを発揮しています。

関連論文リスト

Towards Unified Semantic and Controllable Image Fusion: A Diffusion Transformer Approach [99.80480649258557]
DiTFuseは命令駆動のフレームワークで、単一のモデル内でセマンティクスを意識した融合を実行する。パブリックなIVIF、MFF、MEFベンチマークの実験では、より優れた量的および質的な性能、よりシャープなテクスチャ、より優れたセマンティック保持が確認されている。
論文参考訳（メタデータ） (2025-12-08T05:04:54Z)
Frequency-Spatial Interaction Driven Network for Low-Light Image Enhancement [27.98755235982138]
低照度画像強調(LLIE)は、照明の弱い環境で撮影された画像の知覚や解釈性を改善することを目的としている。 2段階アーキテクチャに基づくLLIEのための新しい周波数空間相互作用駆動ネットワーク(FSIDNet)を開発した。
論文参考訳（メタデータ） (2025-10-25T04:17:50Z)
Exploring Fourier Prior and Event Collaboration for Low-Light Image Enhancement [1.8724535169356553]
イベントカメラは低照度画像強調のための性能向上を提供する。現在、既存のイベントベースのメソッドは、フレームとイベントを直接単一のモデルにフィードする。本稿では,振幅-位相絡み付き可視性回復ネットワークを提案する。第2段階では、空間的ミスマッチを軽減するために、動的アライメントを伴う融合戦略を提案する。
論文参考訳（メタデータ） (2025-08-01T04:25:00Z)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。 PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。 FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳（メタデータ） (2025-03-25T15:04:53Z)
Boosting ViT-based MRI Reconstruction from the Perspectives of Frequency Modulation, Spatial Purification, and Scale Diversification [6.341065683872316]
ViTは、画像の高周波成分を捉えるのに苦労し、局所的なテクスチャやエッジ情報を検出する能力を制限する。コンテンツ中の関連トークンと非関連トークンのうち、MSA(Multi-head self-attention)を計算する。 ViTsのフィードフォワードネットワークは、画像復元に重要なマルチスケール情報をモデル化することができない。
論文参考訳（メタデータ） (2024-12-14T10:03:08Z)
A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文参考訳（メタデータ） (2024-08-31T10:03:19Z)
Addressing Domain Discrepancy: A Dual-branch Collaborative Model to Unsupervised Dehazing [1.6624384368855527]
本稿では、この問題に対処する新しい二分岐協調脱ハージングモデル(DCM-dehaze)を提案する。具体的には,DDSCM (Double Deepwise Separable Convolutional Module) を設計し,より深い特徴の情報を強化する。さらに、画像のエッジ特徴を最適化し、画像の明瞭度と忠実度を高めるために、双方向の輪郭関数を構築した。
論文参考訳（メタデータ） (2024-07-14T14:47:32Z)
ECAFormer: Low-light Image Enhancement using Cross Attention [11.554554006307836]
低照度画像強調(LLIE)はコンピュータビジョンにおいて重要である。我々はクロスアテンショントランス(ECAFormer)による階層的相互強化を設計する。我々は,ECAFormerが複数のベンチマークで競合性能に到達し,PSNRを最適化法よりも3%近く改善したことを示す。
論文参考訳（メタデータ） (2024-06-19T07:21:31Z)
Spatial-frequency Dual-Domain Feature Fusion Network for Low-Light Remote Sensing Image Enhancement [49.15531684596958]
低照度リモートセンシング画像強調のためのDFFN(Dual-Domain Feature Fusion Network)を提案する。第1フェーズは振幅情報を学習して画像輝度を復元し、第2フェーズは位相情報を学習して詳細を洗練させる。我々は、現在の暗光リモートセンシング画像強調におけるデータセットの欠如に対応するために、2つの暗光リモートセンシングデータセットを構築した。
論文参考訳（メタデータ） (2024-04-26T13:21:31Z)
ToddlerDiffusion: Interactive Structured Image Generation with Cascaded Schrödinger Bridge [63.00793292863]
ToddlerDiffusionは、RGB画像生成の複雑なタスクを、よりシンプルで解釈可能なステージに分解するための新しいアプローチである。提案手法はToddler Diffusionと呼ばれ,それぞれが中間表現を生成する責務を担っている。 ToddlerDiffusionは、常に最先端のメソッドより優れています。
論文参考訳（メタデータ） (2023-11-24T15:20:01Z)
Searching a Compact Architecture for Robust Multi-Exposure Image Fusion [55.37210629454589]
2つの大きなスタブリングブロックは、画素の不一致や非効率な推論など、開発を妨げる。本研究では,高機能なマルチ露光画像融合のための自己アライメントとディテールリプレクションモジュールを取り入れたアーキテクチャ検索に基づくパラダイムを提案する。提案手法は様々な競争方式より優れており、一般的なシナリオではPSNRが3.19%向上し、不整合シナリオでは23.5%向上した。
論文参考訳（メタデータ） (2023-05-20T17:01:52Z)
SufrinNet: Toward Sufficient Cross-View Interaction for Stereo Image Enhancement in The Dark [119.01585302856103]
低照度ステレオ画像強調(LLSIE)は、暗黒環境で撮影された視覚的に不快なステレオ画像の品質を高めるための比較的新しいタスクである。 1)クロスビューの相互作用が不十分なこと,2)ビュー内学習に長距離依存が欠如していること,である。 SufrinNet(SufrinNet)を用いた新しいLLSIEモデルを提案する。
論文参考訳（メタデータ） (2022-11-02T04:01:30Z)
GridDehazeNet+: An Enhanced Multi-Scale Network with Intra-Task Knowledge Transfer for Single Image Dehazing [12.982905875008214]
GridDehazeNet+と呼ばれる強化されたマルチスケールネットワークを提案します。プリプロセス、バックボーン、後処理の3つのモジュールで構成されている。
論文参考訳（メタデータ） (2021-03-25T17:35:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。