論文の概要: Towards UAV Image Dehazing: A UAV Atmospheric Scattering Model, Benchmark, and Geometry-Aware Deep Unfolding Network
- arxiv url: http://arxiv.org/abs/2606.16392v1
- Date: Mon, 15 Jun 2026 08:24:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.241739
- Title: Towards UAV Image Dehazing: A UAV Atmospheric Scattering Model, Benchmark, and Geometry-Aware Deep Unfolding Network
- Title(参考訳): UAV画像デハジングに向けて:UAV大気散乱モデル、ベンチマークおよび幾何学的深部展開ネットワーク
- Authors: Wenxuan Fang, Jiangwei Weng, Yu Zheng, Junkai Fan, Guangfa Wang, Xiang Chen, Jian Yang, Jun Li,
- Abstract要約: 物理駆動型脱ハージングフレームワークであるGeometry-aware Proximal Deep Unfolding Network (GP-DUN) を開発した。
GP-DUNは、UASM-HazeSetと実際のUAVハゼベンチマークの両方において、既存の手法を一貫して上回っている。
- 参考スコア(独自算出の注目度): 21.767258930944276
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In UAV applications, haze significantly obscures distant details and weaken structural information, hindering the recovery of details. Current UAV scenarios still face two key challenges: (i) paired hazy/clean images from the real world are unobtainable, while the classical atmospheric scattering model is inadequate for modeling the spatially non-uniform haze in UAV imagery; (ii) existing dehazing methods struggle to remove the heavy haze accumulated in the upper regions of UAV images. To address these issues, we first propose a UAV Atmospheric Scattering Model (UASM), which explicitly incorporates flight altitude, viewing pitch, and extinction to characterize the non-uniform haze distribution in UAV imaging. Based on UASM, we develop a physics-driven dehazing framework, termed Geometry-aware Proximal Deep Unfolding Network (GP-DUN). Specifically, GP-DUN consists of three key modules: a Latent Geometry Estimator (LGE) that infers transmittance consistent with UAV imaging geometry, a Geometry-aware Gradient Descent Module (GeoGDM) that embeds UASM into the data-fidelity term and performs physics-consistent closed-form updates, and an Pooling-Expert Proximal Mapping Module (PE-PMM) that learns an implicit prior to restore textures and structures beyond the capability of explicit physical modeling. In addition, we further construct UASM-HazeSet, which provides controllable paired synthetic data together with 2,285 real UAV haze images for testing. Extensive experiments show that GP-DUN consistently outperforms existing methods on both UASM-HazeSet and real UAV haze benchmarks.
- Abstract(参考訳): UAVの応用において、ヘイズは遠方の詳細を著しく曖昧にし、構造情報を弱め、詳細の回復を妨げる。
現在のUAVシナリオは、2つの大きな課題に直面している。
(i) 実世界のハジー/クリーン画像は観測不可能であり、古典的大気散乱モデルは、UAV画像における空間的に一様でないハズをモデル化するには不十分である。
(II)UAV画像上層部に蓄積する重いヘイズを除去するために既存の脱ヘイズ法は困難である。
これらの問題に対処するために、UAV画像における非均一なヘイズ分布を特徴付けるために、飛行高度、ピッチ、消滅を明示的に組み込んだUAV大気散乱モデル(UASM)を提案する。
UASMに基づく物理駆動型脱ハージングフレームワーク,Geometry-aware Proximal Deep Unfolding Network (GP-DUN) を開発した。
特に、GP-DUNは3つの主要なモジュールで構成されている: 遅延幾何推定器(LGE)はUAV画像幾何に整合した透過性を推論し、幾何認識のグラディエント蛍光モジュール(GeoGDM)はUASMをデータフィデリティ項に埋め込み、物理に一貫性のあるクローズドフォーム更新を実行する。
さらに,UASM-HazeSetは,2,285個の実際のUAV画像とともに,制御可能なペア合成データを提供する。
GP-DUN は UASM-HazeSet と UAV haze のベンチマークにおいて,既存の手法を一貫して上回っている。
関連論文リスト
- CAMF-Det: Closure-Aware Multimodal Fusion for LiDAR-Camera 3D Object Detection on UAV Platforms [9.923404615359223]
LiDARとカメラを用いたマルチモーダル3Dオブジェクト検出は,地上車両のシナリオにおいて優れた性能を示した。
UAVプラットフォーム上でのLiDARカメラ3Dオブジェクト検出のためのクロージャ対応マルチモーダル融合フレームワークであるCAMF-Detを提案する。
我々は、CAMF-Detが全ての難易度で最高のパフォーマンスを達成し、ハードレベルのmAP$_mathrmBEV$9.43%と4.88%の最高の競合手法で改善したことを示す。
論文 参考訳(メタデータ) (2026-06-08T07:40:17Z) - Visual Prototype Conditioned Focal Region Generation for UAV-Based Object Detection [23.097895224926905]
無人航空機(UAV)に基づく物体検出は、限られた注釈付きトレーニングデータで動的に変化するシナリオに適用する場合、重要ではあるが困難な課題である。
UAVに基づくオブジェクト検出に適した新しいレイアウト・ツー・イメージ生成フレームワークであるUAVGenを提案する。
本手法は最先端の手法を著しく上回り、異なる検出器と統合した場合の精度を一貫して向上させる。
論文 参考訳(メタデータ) (2026-04-03T11:00:24Z) - UAV-MM3D: A Large-Scale Synthetic Benchmark for 3D Perception of Unmanned Aerial Vehicles with Multi-Modal Data [47.317955428393134]
UAV-MM3Dは,低高度UAV知覚と動作理解のための多モード合成データセットである。
様々なシーン(都市部、郊外部、森林部、沿岸部)と気象条件にまたがる400Kの同期フレームで構成されている。
各フレームは2D/3Dバウンディングボックス、6-DoFのポーズ、インスタンスレベルのアノテーションを提供し、3D検出、ポーズ推定、ターゲット追跡、短期軌道予測などのUAVに関連するコアタスクを可能にする。
論文 参考訳(メタデータ) (2025-11-27T12:30:28Z) - Neural 3D Object Reconstruction with Small-Scale Unmanned Aerial Vehicles [16.745245388756533]
小型無人航空機(UAV)は、屋内と難航地域を航行する大きな可能性を秘めている。
本稿では,100グラム以下のUAVを用いた静的物体の完全自律・高忠実な3次元走査を可能にするシステムアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-09-15T21:08:32Z) - Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos [58.156141601478794]
マルチオブジェクトトラッキング(UAVT)は、ビデオのフレーム間で一貫したアイデンティティを維持しながら、複数のオブジェクトを追跡することを目的としている。
既存の手法は、通常、動作キューと外観を別々にモデル化し、それらの相互作用を見渡して、最適下追跡性能をもたらす。
本稿では、AMC行列とMTCモジュールの2つの主要コンポーネントを通して、外観と動きの手がかりを利用するAMOTを提案する。
論文 参考訳(メタデータ) (2025-08-03T12:06:47Z) - LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - UAVTwin: Neural Digital Twins for UAVs using Gaussian Splatting [57.63613048492219]
UAVTwinは,無人航空機(UAV)に埋め込まれた下流モデルの訓練を行うための,実環境からデジタル双生児を作成する方法である。
これは、背景を再構築するための3Dガウススティング(3DGS)と、多様な外観と動作を複数のポーズで表示する制御可能な合成人間モデルを統合することで実現される。
論文 参考訳(メタデータ) (2025-04-02T22:17:30Z) - DiAD: A Diffusion-based Framework for Multi-class Anomaly Detection [55.48770333927732]
本稿では,拡散型異常検出(Difusion-based Anomaly Detection, DAD)フレームワークを提案する。
画素空間オートエンコーダ、安定拡散の復調ネットワークに接続する潜在空間セマンティックガイド(SG)ネットワーク、特徴空間事前学習機能抽出器から構成される。
MVTec-ADとVisAデータセットの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-12-11T18:38:28Z) - A Multi-purpose Real Haze Benchmark with Quantifiable Haze Levels and
Ground Truth [61.90504318229845]
本稿では,ハズフリー画像とその場でのハズ密度測定を併用した,最初の実画像ベンチマークデータセットを提案する。
このデータセットはコントロールされた環境で生成され、プロの煙発生装置がシーン全体を覆っている。
このデータセットのサブセットは、CVPR UG2 2022 チャレンジの Haze Track における Object Detection に使用されている。
論文 参考訳(メタデータ) (2022-06-13T19:14:06Z) - Domain-Aware Unsupervised Hyperspectral Reconstruction for Aerial Image
Dehazing [16.190455993566864]
空中画像におけるヘイズ除去のためのSkyGANを提案する。
SkyGANは、1)ドメイン対応のH2Hモジュール、2)条件付きGAN(cGAN)ベースのマルチキュー画像-画像変換モジュール(I2I)から構成される。
論文 参考訳(メタデータ) (2020-11-07T03:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。