論文の概要: Dual-Stage Global and Local Feature Framework for Image Dehazing
- arxiv url: http://arxiv.org/abs/2509.00108v1
- Date: Thu, 28 Aug 2025 09:03:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.085054
- Title: Dual-Stage Global and Local Feature Framework for Image Dehazing
- Title(参考訳): 画像デハージングのための2段階的グローバル・ローカル特徴フレームワーク
- Authors: Anas M. Ali, Anis Koubaa, Bilel Benjdira,
- Abstract要約: 我々はStreamlined Global and Local Features Combinator(SGLC)と呼ばれる新しいフレームワークを提案する。
我々のアプローチは、Global Features Generator(GFG)とLocal Features Enhancer(LFE)の2つの主要コンポーネントで構成されています。
高分解能データセットによる実験結果から,SGLCを用いた場合のピーク信号-雑音比(PSNR)の大幅な改善が示された。
- 参考スコア(独自算出の注目度): 7.536829470604261
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Addressing the challenge of removing atmospheric fog or haze from digital images, known as image dehazing, has recently gained significant traction in the computer vision community. Although contemporary dehazing models have demonstrated promising performance, few have thoroughly investigated high-resolution imagery. In such scenarios, practitioners often resort to downsampling the input image or processing it in smaller patches, which leads to a notable performance degradation. This drop is primarily linked to the difficulty of effectively combining global contextual information with localized, fine-grained details as the spatial resolution grows. In this chapter, we propose a novel framework, termed the Streamlined Global and Local Features Combinator (SGLC), to bridge this gap and enable robust dehazing for high-resolution inputs. Our approach is composed of two principal components: the Global Features Generator (GFG) and the Local Features Enhancer (LFE). The GFG produces an initial dehazed output by focusing on broad contextual understanding of the scene. Subsequently, the LFE refines this preliminary output by enhancing localized details and pixel-level features, thereby capturing the interplay between global appearance and local structure. To evaluate the effectiveness of SGLC, we integrated it with the Uformer architecture, a state-of-the-art dehazing model. Experimental results on high-resolution datasets reveal a considerable improvement in peak signal-to-noise ratio (PSNR) when employing SGLC, indicating its potency in addressing haze in large-scale imagery. Moreover, the SGLC design is model-agnostic, allowing any dehazing network to be augmented with the proposed global-and-local feature fusion mechanism. Through this strategy, practitioners can harness both scene-level cues and granular details, significantly improving visual fidelity in high-resolution environments.
- Abstract(参考訳): 画像デハジング(英語版)として知られるデジタル画像から大気の霧や迷路を取り除くという課題に対処し、コンピュータビジョンコミュニティでは近年、大きな注目を集めている。
現代のデハジングモデルは有望な性能を示しているが、高解像度の画像について徹底的に研究しているものは少ない。
このようなシナリオでは、インプットイメージをダウンサンプリングしたり、より小さなパッチで処理することで、パフォーマンスが著しく低下する。
この落下は、空間分解能が増大するにつれて、グローバルな文脈情報と局所的できめ細かい詳細を効果的に組み合わせることの難しさに主に関係している。
本稿では,SGLC(Streamlined Global and Local Features Combinator)と呼ばれる新しいフレームワークを提案する。
提案手法は,Global Features Generator (GFG) とLocal Features Enhancer (LFE) の2つの主要コンポーネントから構成される。
GFGは、シーンの広い文脈的理解に焦点をあてて、初期デハズドアウトプットを生成する。
その後、LFEは、この予備出力を、局所化の詳細と画素レベルの特徴を強化して洗練し、グローバルな外観と局所構造の間の相互作用を捉える。
SGLCの有効性を評価するため,最先端デハージングモデルであるUformerアーキテクチャと統合した。
高分解能データセットによる実験結果から,SGLCを用いた場合のピーク信号対雑音比(PSNR)は著しく向上し,大規模画像におけるヘイズ対策の有効性を示した。
さらに、SGLCの設計はモデルに依存しないため、デハージングネットワークをグローバル・ローカルな特徴融合機構で拡張することができる。
この戦略により、実践者はシーンレベルの手がかりと詳細な詳細の両方を活用でき、高解像度環境における視覚的忠実度を大幅に向上させることができる。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network For Salient Object Detection in Optical Remote Sensing Images [60.296124001189646]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - HRSeg: High-Resolution Visual Perception and Enhancement for Reasoning Segmentation [74.1872891313184]
HRSegは高精細な知覚を持つ効率的なモデルである。
高分解能知覚(HRP)と高分解能増強(HRE)の2つの重要な革新を特徴としている。
論文 参考訳(メタデータ) (2025-07-17T08:09:31Z) - A Global-Local Cross-Attention Network for Ultra-high Resolution Remote Sensing Image Semantic Segmentation [1.833928124984226]
GLCANetはUHRリモートセンシングのための軽量セグメンテーションフレームワークである。
セルフアテンションメカニズムは、長距離依存関係を強化し、グローバル機能を強化し、セマンティック一貫性を改善するためにローカル詳細を保存する。
マスク付きクロスアテンション機構は、グローバルローカルな特徴を適応的に融合させ、グローバルコンテキストを活用しながら細かな詳細を選択的に強化し、セグメンテーション精度を向上させる。
論文 参考訳(メタデータ) (2025-06-24T08:20:08Z) - HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts [77.62320553269615]
HiPromptは高解像度画像生成のためのチューニング不要のソリューションである。
階層的なプロンプトは グローバルとローカルの両方のガイダンスを提供する
生成された画像は、高定義のコヒーレントな局所的および大域的意味論、構造、テクスチャを保持する。
論文 参考訳(メタデータ) (2024-09-04T17:58:08Z) - Streamlined Global and Local Features Combinator (SGLC) for High
Resolution Image Dehazing [0.9453554184019107]
Image Dehazingは、画像から大気の霧や霧を取り除くことを目的としています。
この種の画像の場合、モデルは画像のダウンスケールバージョンや、それから採取したパッチで作業する必要がある。
本稿では,これらの問題を解決するためにStreamlined Global and Local Features Combinator (SGLC)を提案する。
論文 参考訳(メタデータ) (2023-04-26T08:34:00Z) - GLFF: Global and Local Feature Fusion for AI-synthesized Image Detection [29.118321046339656]
画像全体から複数スケールのグローバルな特徴と、AI合成画像検出のための情報パッチからの洗練されたローカル特徴を組み合わせることで、リッチで差別的な表現を学習するフレームワークを提案する。
GLFFは、マルチスケールの意味的特徴を抽出するグローバルブランチと、詳細なローカルアーティファクト抽出のための情報パッチを選択するローカルブランチの2つのブランチから情報を抽出する。
論文 参考訳(メタデータ) (2022-11-16T02:03:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。