論文の概要: FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing
- arxiv url: http://arxiv.org/abs/2407.00972v1
- Date: Mon, 1 Jul 2024 05:16:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 00:36:18.774117
- Title: FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing
- Title(参考訳): FALCON: 高速単一画像デハージングのための連続密度マスク付き周波数結合リンク
- Authors: Donghyun Kim, Seil Kang, Seong Jae Hwang,
- Abstract要約: この研究は、品質と速度の両面で最先端の性能を達成するシングルイメージデハージングシステムであるFALCONを紹介する。
本研究では, 連続密度マスクを用いた大気散乱モデルに基づいて, 基礎となるヘイズ分布を利用する。
複数の最先端手法とアブレーション解析を含む実験は、FALCONの脱ハージング品質と速度の両方における異常な性能を実証している。
- 参考スコア(独自算出の注目度): 8.703680337470285
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image dehazing, addressing atmospheric interference like fog and haze, remains a pervasive challenge crucial for robust vision applications such as surveillance and remote sensing under adverse visibility. While various methodologies have evolved from early works predicting transmission matrix and atmospheric light features to deep learning and dehazing networks, they innately prioritize dehazing quality metrics, neglecting the need for real-time applicability in time-sensitive domains like autonomous driving. This work introduces FALCON (Frequency Adjoint Link with CONtinuous density mask), a single-image dehazing system achieving state-of-the-art performance on both quality and speed. Particularly, we develop a novel bottleneck module, namely, Frequency Adjoint Link, operating in the frequency space to globally expand the receptive field with minimal growth in network size. Further, we leverage the underlying haze distribution based on the atmospheric scattering model via a Continuous Density Mask (CDM) which serves as a continuous-valued mask input prior and a differentiable auxiliary loss. Comprehensive experiments involving multiple state-of-the-art methods and ablation analysis demonstrate FALCON's exceptional performance in both dehazing quality and speed (i.e., >$180 frames-per-second), quantified by metrics such as FPS, PSNR, and SSIM.
- Abstract(参考訳): 霧や霧のような大気の干渉に対処するイメージデハジングは、監視やリモートセンシングといった堅牢な視覚的応用において、不透明な視界下で重要な課題である。
トランスミッションマトリックスや大気光の特徴を予測する初期の研究からディープラーニングやデハージングネットワークまで、さまざまな手法が進化してきたが、彼らは本来、デハージング品質の指標を優先し、自律運転のような時間に敏感な領域におけるリアルタイム適用性の必要性を無視した。
本研究では,FALCON(Frequency Adjoint Link with Continuous density mask)を導入する。
特に,周波数アジョイントリンクという新たなボトルネックモジュールを開発し,ネットワークサイズが最小限に抑えられた受容場をグローバルに拡張する。
さらに, 連続密度マスク (CDM) を用いた大気散乱モデルに基づく基礎的ヘイズ分布を, 連続値マスク入力と相違可能な補助損失として活用する。
複数の最先端の手法とアブレーション分析を含む総合的な実験は、FALCONのデハージング品質と速度(すなわち、1秒あたり180フレーム)において例外的な性能を示し、FPS、PSNR、SSIMなどのメトリクスによって定量化されている。
関連論文リスト
- SpectralMamba: Efficient Mamba for Hyperspectral Image Classification [39.18999103115206]
リカレントニューラルネットワークとトランスフォーマーは、ハイパースペクトル(HS)イメージングにおけるほとんどの応用を支配している。
我々は、HS画像分類のための効率的なディープラーニングフレームワークを組み込んだ新しい状態空間モデルであるSpectralMambaを提案する。
SpectralMambaは、パフォーマンスと効率の両面から、驚くほど有望な勝利を生み出している。
論文 参考訳(メタデータ) (2024-04-12T14:12:03Z) - Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask
Detection [12.160085404239446]
本稿では,FASTENと呼ばれる新しい3次元マスク検出フレームワークを提案する。
ネットワークが大きな動きの細部に集中するように調整することで、余分な時間的特徴干渉を排除できる。
FASTENは5フレームの入力しか必要とせず、データ内評価とクロスデータセット評価の両方で8つの競合より優れている。
論文 参考訳(メタデータ) (2023-10-25T11:54:21Z) - Theoretical framework for real time sub-micron depth monitoring using
quantum inline coherent imaging [55.2480439325792]
インラインコヒーレントイメージング(ICI)は、キーホール溶接、添加物製造、マイクロ加工など、様々なレーザプロセスのリアルタイム監視のための信頼性の高い手法である。
軸方向分解能は2m以上に限定されており、ICIはサブミクロンプロセスの監視には適さない。
量子光コヒーレンス・トモグラフィ(Q OCT)の進歩は、1m以上の奥行き分解能を達成してこの問題に対処する可能性がある。
論文 参考訳(メタデータ) (2023-09-17T17:05:21Z) - DADFNet: Dual Attention and Dual Frequency-Guided Dehazing Network for
Video-Empowered Intelligent Transportation [79.18450119567315]
逆の気象条件は、ビデオベースの交通監視に深刻な課題をもたらす。
本稿では,リアルタイム視認性向上のための2つの注意と2つの周波数誘導型脱ハージングネットワーク(DADFNet)を提案する。
論文 参考訳(メタデータ) (2023-04-19T11:55:30Z) - Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。
MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。
MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文 参考訳(メタデータ) (2022-06-15T17:58:30Z) - FCL-GAN: A Lightweight and Real-Time Baseline for Unsupervised Blind
Image Deblurring [72.43250555622254]
本稿では,周波数領域の競合損失制約型軽量サイクルGANと呼ばれる,軽量でリアルタイムな非教師付きBIDベースラインを提案する。
FCL-GANは、画像領域制限がなく、画像解像度制限がなく、SOTAより25倍軽く、SOTAより5倍高速である。
いくつかの画像データセットの実験では、性能、モデルサイズ、参照時間の観点からFCL-GANの有効性が示されている。
論文 参考訳(メタデータ) (2022-04-16T15:08:03Z) - Mask-guided Spectral-wise Transformer for Efficient Hyperspectral Image
Reconstruction [127.20208645280438]
ハイパースペクトル画像(HSI)再構成は、2次元計測から3次元空間スペクトル信号を復元することを目的としている。
スペクトル間相互作用のモデル化は、HSI再構成に有用である。
Mask-guided Spectral-wise Transformer (MST) は,HSI再構成のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-15T16:59:48Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Efficient Two-Stream Network for Violence Detection Using Separable
Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。
SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。
我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文 参考訳(メタデータ) (2021-02-21T12:01:48Z) - Deep Frequent Spatial Temporal Learning for Face Anti-Spoofing [9.435020319411311]
対面防止は, 提示攻撃による侵入を避けることにより, 顔認識システムのセキュリティに不可欠である。
従来の研究は、この課題に深度と時間的監督を用いることの有効性を示した。
本稿では, 頻繁, 空間的, 時間的情報を同時に活用する顔アンチスプーフィングのための新しい2つのストリームFreqSaptialTemporalNetを提案する。
論文 参考訳(メタデータ) (2020-01-20T06:02:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。