Fugu-MT 論文翻訳(概要): Dual-Stage Global and Local Feature Framework for Image Dehazing

論文の概要: Dual-Stage Global and Local Feature Framework for Image Dehazing

arxiv url: http://arxiv.org/abs/2509.00108v1
Date: Thu, 28 Aug 2025 09:03:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-04 15:17:03.085054
Title: Dual-Stage Global and Local Feature Framework for Image Dehazing
Title（参考訳）: 画像デハージングのための2段階的グローバル・ローカル特徴フレームワーク
Authors: Anas M. Ali, Anis Koubaa, Bilel Benjdira,
Abstract要約: 我々はStreamlined Global and Local Features Combinator(SGLC)と呼ばれる新しいフレームワークを提案する。我々のアプローチは、Global Features Generator(GFG)とLocal Features Enhancer(LFE)の2つの主要コンポーネントで構成されています。高分解能データセットによる実験結果から,SGLCを用いた場合のピーク信号-雑音比(PSNR)の大幅な改善が示された。
参考スコア（独自算出の注目度）: 7.536829470604261
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Addressing the challenge of removing atmospheric fog or haze from digital images, known as image dehazing, has recently gained significant traction in the computer vision community. Although contemporary dehazing models have demonstrated promising performance, few have thoroughly investigated high-resolution imagery. In such scenarios, practitioners often resort to downsampling the input image or processing it in smaller patches, which leads to a notable performance degradation. This drop is primarily linked to the difficulty of effectively combining global contextual information with localized, fine-grained details as the spatial resolution grows. In this chapter, we propose a novel framework, termed the Streamlined Global and Local Features Combinator (SGLC), to bridge this gap and enable robust dehazing for high-resolution inputs. Our approach is composed of two principal components: the Global Features Generator (GFG) and the Local Features Enhancer (LFE). The GFG produces an initial dehazed output by focusing on broad contextual understanding of the scene. Subsequently, the LFE refines this preliminary output by enhancing localized details and pixel-level features, thereby capturing the interplay between global appearance and local structure. To evaluate the effectiveness of SGLC, we integrated it with the Uformer architecture, a state-of-the-art dehazing model. Experimental results on high-resolution datasets reveal a considerable improvement in peak signal-to-noise ratio (PSNR) when employing SGLC, indicating its potency in addressing haze in large-scale imagery. Moreover, the SGLC design is model-agnostic, allowing any dehazing network to be augmented with the proposed global-and-local feature fusion mechanism. Through this strategy, practitioners can harness both scene-level cues and granular details, significantly improving visual fidelity in high-resolution environments.
Abstract（参考訳）: 画像デハジング(英語版)として知られるデジタル画像から大気の霧や迷路を取り除くという課題に対処し、コンピュータビジョンコミュニティでは近年、大きな注目を集めている。現代のデハジングモデルは有望な性能を示しているが、高解像度の画像について徹底的に研究しているものは少ない。このようなシナリオでは、インプットイメージをダウンサンプリングしたり、より小さなパッチで処理することで、パフォーマンスが著しく低下する。この落下は、空間分解能が増大するにつれて、グローバルな文脈情報と局所的できめ細かい詳細を効果的に組み合わせることの難しさに主に関係している。本稿では,SGLC(Streamlined Global and Local Features Combinator)と呼ばれる新しいフレームワークを提案する。提案手法は,Global Features Generator (GFG) とLocal Features Enhancer (LFE) の2つの主要コンポーネントから構成される。 GFGは、シーンの広い文脈的理解に焦点をあてて、初期デハズドアウトプットを生成する。その後、LFEは、この予備出力を、局所化の詳細と画素レベルの特徴を強化して洗練し、グローバルな外観と局所構造の間の相互作用を捉える。 SGLCの有効性を評価するため,最先端デハージングモデルであるUformerアーキテクチャと統合した。高分解能データセットによる実験結果から,SGLCを用いた場合のピーク信号対雑音比(PSNR)は著しく向上し,大規模画像におけるヘイズ対策の有効性を示した。さらに、SGLCの設計はモデルに依存しないため、デハージングネットワークをグローバル・ローカルな特徴融合機構で拡張することができる。この戦略により、実践者はシーンレベルの手がかりと詳細な詳細の両方を活用でき、高解像度環境における視覚的忠実度を大幅に向上させることができる。

関連論文リスト

API: Empowering Generalizable Real-World Image Dehazing via Adaptive Patch Importance Learning [12.516890497421203]
本稿では,現実のデハジングを一般化するための新しいアダプティブ・パッチ・コンパタンス・アウェア(API)フレームワークを提案する。具体的には,自動ヘイズ生成(AHG)モジュールと密度認識ヘイズ除去(DHR)モジュールから構成される。さらに,デハズド画像の曖昧さを軽減するために,MNCD(Multi-Negative Contrastive Dehazing)を新たに導入する。
論文参考訳（メタデータ） (2026-01-05T10:53:41Z)
Attention to Detail: Global-Local Attention for High-Resolution AI-Generated Image Detection [0.0]
GLASSは、グローバルに再サイズされたビューと、ランダムにサンプリングされた複数のローカル作物を組み合わせたアーキテクチャである。視覚モデルに統合することで、任意のサイズの画像のグローバル情報とローカル情報の両方を活用することができる。
論文参考訳（メタデータ） (2026-01-01T00:00:07Z)
Scale-DiT: Ultra-High-Resolution Image Generation with Hierarchical Local Attention [50.391914489898774]
Scale-DiTは、階層的な局所的注意を低解像度のグローバルガイダンスで導入する新しい拡散フレームワークである。軽量なLoRA適応は、デノナイズ中のグローバルパスとローカルパスをブリッジし、構造と詳細の整合性を確保する。実験によると、Scale-DiTは2ドル以上の高速な推論とメモリ使用量の削減を実現している。
論文参考訳（メタデータ） (2025-10-18T03:15:26Z)
GCRPNet: Graph-Enhanced Contextual and Regional Perception Network For Salient Object Detection in Optical Remote Sensing Images [60.296124001189646]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文参考訳（メタデータ） (2025-08-14T11:31:43Z)
HRSeg: High-Resolution Visual Perception and Enhancement for Reasoning Segmentation [74.1872891313184]
HRSegは高精細な知覚を持つ効率的なモデルである。高分解能知覚(HRP)と高分解能増強(HRE)の2つの重要な革新を特徴としている。
論文参考訳（メタデータ） (2025-07-17T08:09:31Z)
A Global-Local Cross-Attention Network for Ultra-high Resolution Remote Sensing Image Semantic Segmentation [1.833928124984226]
GLCANetはUHRリモートセンシングのための軽量セグメンテーションフレームワークである。セルフアテンションメカニズムは、長距離依存関係を強化し、グローバル機能を強化し、セマンティック一貫性を改善するためにローカル詳細を保存する。マスク付きクロスアテンション機構は、グローバルローカルな特徴を適応的に融合させ、グローバルコンテキストを活用しながら細かな詳細を選択的に強化し、セグメンテーション精度を向上させる。
論文参考訳（メタデータ） (2025-06-24T08:20:08Z)
VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文参考訳（メタデータ） (2025-05-02T12:21:44Z)
HiPrompt: Tuning-free Higher-Resolution Generation with Hierarchical MLLM Prompts [77.62320553269615]
HiPromptは高解像度画像生成のためのチューニング不要のソリューションである。階層的なプロンプトはグローバルとローカルの両方のガイダンスを提供する生成された画像は、高定義のコヒーレントな局所的および大域的意味論、構造、テクスチャを保持する。
論文参考訳（メタデータ） (2024-09-04T17:58:08Z)
Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文参考訳（メタデータ） (2023-10-08T06:10:09Z)
Streamlined Global and Local Features Combinator (SGLC) for High Resolution Image Dehazing [0.9453554184019107]
Image Dehazingは、画像から大気の霧や霧を取り除くことを目的としています。この種の画像の場合、モデルは画像のダウンスケールバージョンや、それから採取したパッチで作業する必要がある。本稿では,これらの問題を解決するためにStreamlined Global and Local Features Combinator (SGLC)を提案する。
論文参考訳（メタデータ） (2023-04-26T08:34:00Z)
GLFF: Global and Local Feature Fusion for AI-synthesized Image Detection [29.118321046339656]
画像全体から複数スケールのグローバルな特徴と、AI合成画像検出のための情報パッチからの洗練されたローカル特徴を組み合わせることで、リッチで差別的な表現を学習するフレームワークを提案する。 GLFFは、マルチスケールの意味的特徴を抽出するグローバルブランチと、詳細なローカルアーティファクト抽出のための情報パッチを選択するローカルブランチの2つのブランチから情報を抽出する。
論文参考訳（メタデータ） (2022-11-16T02:03:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。