Fugu-MT 論文翻訳(概要): FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing

論文の概要: FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing

arxiv url: http://arxiv.org/abs/2407.00972v1
Date: Mon, 1 Jul 2024 05:16:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-04 00:36:18.774117
Title: FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing
Title（参考訳）: FALCON: 高速単一画像デハージングのための連続密度マスク付き周波数結合リンク
Authors: Donghyun Kim, Seil Kang, Seong Jae Hwang,
Abstract要約: この研究は、品質と速度の両面で最先端の性能を達成するシングルイメージデハージングシステムであるFALCONを紹介する。本研究では, 連続密度マスクを用いた大気散乱モデルに基づいて, 基礎となるヘイズ分布を利用する。複数の最先端手法とアブレーション解析を含む実験は、FALCONの脱ハージング品質と速度の両方における異常な性能を実証している。
参考スコア（独自算出の注目度）: 8.703680337470285
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Image dehazing, addressing atmospheric interference like fog and haze, remains a pervasive challenge crucial for robust vision applications such as surveillance and remote sensing under adverse visibility. While various methodologies have evolved from early works predicting transmission matrix and atmospheric light features to deep learning and dehazing networks, they innately prioritize dehazing quality metrics, neglecting the need for real-time applicability in time-sensitive domains like autonomous driving. This work introduces FALCON (Frequency Adjoint Link with CONtinuous density mask), a single-image dehazing system achieving state-of-the-art performance on both quality and speed. Particularly, we develop a novel bottleneck module, namely, Frequency Adjoint Link, operating in the frequency space to globally expand the receptive field with minimal growth in network size. Further, we leverage the underlying haze distribution based on the atmospheric scattering model via a Continuous Density Mask (CDM) which serves as a continuous-valued mask input prior and a differentiable auxiliary loss. Comprehensive experiments involving multiple state-of-the-art methods and ablation analysis demonstrate FALCON's exceptional performance in both dehazing quality and speed (i.e., >$180 frames-per-second), quantified by metrics such as FPS, PSNR, and SSIM.
Abstract（参考訳）: 霧や霧のような大気の干渉に対処するイメージデハジングは、監視やリモートセンシングといった堅牢な視覚的応用において、不透明な視界下で重要な課題である。トランスミッションマトリックスや大気光の特徴を予測する初期の研究からディープラーニングやデハージングネットワークまで、さまざまな手法が進化してきたが、彼らは本来、デハージング品質の指標を優先し、自律運転のような時間に敏感な領域におけるリアルタイム適用性の必要性を無視した。本研究では,FALCON(Frequency Adjoint Link with Continuous density mask)を導入する。特に,周波数アジョイントリンクという新たなボトルネックモジュールを開発し,ネットワークサイズが最小限に抑えられた受容場をグローバルに拡張する。さらに, 連続密度マスク (CDM) を用いた大気散乱モデルに基づく基礎的ヘイズ分布を, 連続値マスク入力と相違可能な補助損失として活用する。複数の最先端の手法とアブレーション分析を含む総合的な実験は、FALCONのデハージング品質と速度(すなわち、1秒あたり180フレーム)において例外的な性能を示し、FPS、PSNR、SSIMなどのメトリクスによって定量化されている。

関連論文リスト

Efficient Sequential Neural Network with Spatial-Temporal Attention and Linear LSTM for Robust Lane Detection Using Multi-Frame Images [3.8825198843426345]
レーン検出は、自動走行車(AV)と先進運転支援システムにとって重要な認識課題である。現行の手法では、正確で堅牢でリアルタイムに車線検出を実現するための汎用性が欠如している。本研究では,車線の重要な特徴に焦点をあてる空間的注意機構を備えた新しい逐次ニューラルネットワークモデルを提案する。
論文参考訳（メタデータ） (2026-02-03T15:51:29Z)
HAD: Hierarchical Asymmetric Distillation to Bridge Spatio-Temporal Gaps in Event-Based Object Tracking [80.07224739976911]
イベントカメラは例外的な時間分解能と範囲(モード)を提供する RGBカメラは高解像度でリッチテクスチャを捉えるのに優れていますが、イベントカメラは例外的な時間分解能とレンジ(モダル)を提供します。
論文参考訳（メタデータ） (2025-10-22T13:15:13Z)
FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文参考訳（メタデータ） (2025-06-17T02:33:42Z)
Dual-Domain Masked Image Modeling: A Self-Supervised Pretraining Strategy Using Spatial and Frequency Domain Masking for Hyperspectral Data [35.34526230299484]
本稿では,ラベルなしデータの大部分を利用するハイパースペクトルデータに対する自己教師付き事前学習戦略を提案する。本稿では,空間領域と周波数領域の両方で動作する新しい二重ドメインマスキング機構を提案する。提案手法を3つの公開HSI分類ベンチマークで評価し,現状の性能を実証した。
論文参考訳（メタデータ） (2025-05-06T06:24:21Z)
FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。 FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文参考訳（メタデータ） (2025-04-02T22:03:11Z)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。 PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。 FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳（メタデータ） (2025-03-25T15:04:53Z)
CoSimGen: Controllable Diffusion Model for Simultaneous Image and Mask Generation [1.9393128408121891]
既存の生成モデルは、高品質で同時画像マスク生成の必要性に対処できない。本稿では,同時画像生成とマスク生成を同時に行うための拡散型フレームワークであるCoSimGenを提案する。 CoSimGenはすべてのデータセットで最先端のパフォーマンスを達成し、データセットで0.11、LPIPSで0.53の最低KIDを達成した。
論文参考訳（メタデータ） (2025-03-25T13:48:22Z)
DehazeMamba: SAR-guided Optical Remote Sensing Image Dehazing with Adaptive State Space Model [27.83437788159158]
DehazeMambaはプログレッシブ・ヘイズ・デカップリング・フュージョン・ストラテジー上に構築された新規なSAR誘導脱ヘイズ・ネットワークである。提案手法は,光-SAR差分解析によるヘイズ影響領域を動的に同定するHPDMと,特徴量評価に基づく2段階融合プロセスによるドメインシフトを緩和するプログレッシブ・フュージョン・モジュール (PFM) である。大規模な実験により、DehazeMambaは最先端の手法を著しく上回り、PSNRの0.73dB改善と下流タスクの大幅な強化を実現している。
論文参考訳（メタデータ） (2025-03-17T11:25:05Z)
Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。 Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。 nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-12-28T14:23:58Z)
SpectralMamba: Efficient Mamba for Hyperspectral Image Classification [39.18999103115206]
リカレントニューラルネットワークとトランスフォーマーは、ハイパースペクトル(HS)イメージングにおけるほとんどの応用を支配している。我々は、HS画像分類のための効率的なディープラーニングフレームワークを組み込んだ新しい状態空間モデルであるSpectralMambaを提案する。 SpectralMambaは、パフォーマンスと効率の両面から、驚くほど有望な勝利を生み出している。
論文参考訳（メタデータ） (2024-04-12T14:12:03Z)
Flow-Attention-based Spatio-Temporal Aggregation Network for 3D Mask Detection [12.160085404239446]
本稿では,FASTENと呼ばれる新しい3次元マスク検出フレームワークを提案する。ネットワークが大きな動きの細部に集中するように調整することで、余分な時間的特徴干渉を排除できる。 FASTENは5フレームの入力しか必要とせず、データ内評価とクロスデータセット評価の両方で8つの競合より優れている。
論文参考訳（メタデータ） (2023-10-25T11:54:21Z)
Theoretical framework for real time sub-micron depth monitoring using quantum inline coherent imaging [55.2480439325792]
インラインコヒーレントイメージング(ICI)は、キーホール溶接、添加物製造、マイクロ加工など、様々なレーザプロセスのリアルタイム監視のための信頼性の高い手法である。軸方向分解能は2m以上に限定されており、ICIはサブミクロンプロセスの監視には適さない。量子光コヒーレンス・トモグラフィ(Q OCT)の進歩は、1m以上の奥行き分解能を達成してこの問題に対処する可能性がある。
論文参考訳（メタデータ） (2023-09-17T17:05:21Z)
DADFNet: Dual Attention and Dual Frequency-Guided Dehazing Network for Video-Empowered Intelligent Transportation [79.18450119567315]
逆の気象条件は、ビデオベースの交通監視に深刻な課題をもたらす。本稿では,リアルタイム視認性向上のための2つの注意と2つの周波数誘導型脱ハージングネットワーク(DADFNet)を提案する。
論文参考訳（メタデータ） (2023-04-19T11:55:30Z)
S^2-Transformer for Mask-Aware Hyperspectral Image Reconstruction [59.39343894089959]
トランスフォーマー再構成バックエンドを備えたスナップショット圧縮撮像器(CASSI)は、高忠実度センシング性能を示す。空間的およびスペクトル的アテンションデザインはハイパースペクトルモデリングの限界を示しますパラレルアテンション設計とマスク認識学習戦略により実装された空間スペクトル(S2-)変換器を提案する。
論文参考訳（メタデータ） (2022-09-24T19:26:46Z)
Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。 MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。 MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文参考訳（メタデータ） (2022-06-15T17:58:30Z)
FCL-GAN: A Lightweight and Real-Time Baseline for Unsupervised Blind Image Deblurring [72.43250555622254]
本稿では,周波数領域の競合損失制約型軽量サイクルGANと呼ばれる,軽量でリアルタイムな非教師付きBIDベースラインを提案する。 FCL-GANは、画像領域制限がなく、画像解像度制限がなく、SOTAより25倍軽く、SOTAより5倍高速である。いくつかの画像データセットの実験では、性能、モデルサイズ、参照時間の観点からFCL-GANの有効性が示されている。
論文参考訳（メタデータ） (2022-04-16T15:08:03Z)
Mask-guided Spectral-wise Transformer for Efficient Hyperspectral Image Reconstruction [127.20208645280438]
ハイパースペクトル画像(HSI)再構成は、2次元計測から3次元空間スペクトル信号を復元することを目的としている。スペクトル間相互作用のモデル化は、HSI再構成に有用である。 Mask-guided Spectral-wise Transformer (MST) は,HSI再構成のための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2021-11-15T16:59:48Z)
TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文参考訳（メタデータ） (2021-04-02T01:42:01Z)
Efficient Two-Stream Network for Violence Detection Using Separable Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。 SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文参考訳（メタデータ） (2021-02-21T12:01:48Z)
Deep Frequent Spatial Temporal Learning for Face Anti-Spoofing [9.435020319411311]
対面防止は, 提示攻撃による侵入を避けることにより, 顔認識システムのセキュリティに不可欠である。従来の研究は、この課題に深度と時間的監督を用いることの有効性を示した。本稿では, 頻繁, 空間的, 時間的情報を同時に活用する顔アンチスプーフィングのための新しい2つのストリームFreqSaptialTemporalNetを提案する。
論文参考訳（メタデータ） (2020-01-20T06:02:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。