Fugu-MT 論文翻訳(概要): F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation

論文の概要: F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation

arxiv url: http://arxiv.org/abs/2506.07847v1
Date: Mon, 09 Jun 2025 15:09:49 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-10 16:33:11.014755
Title: F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation
Title（参考訳）: F2Net:超高分解能リモートセンシングセグメンテーションのための周波数融合ネットワーク
Authors: Hengzhi Chen, Liqian Feng, Wenhua Wu, Xiaogang Zhu, Shawn Leo, Kun Hu,
Abstract要約: F2Netは、UHR画像を特殊な処理のために高周波数成分と低周波数成分に分解する周波数認識フレームワークである。ハイブリッド周波数融合モジュールは、2つの新しい目的によって導かれるこれらの観測を統合する。 F2Netは、それぞれ80.22のmIoUと83.39の最先端のパフォーマンスを実現している。
参考スコア（独自算出の注目度）: 10.67983913373955
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Semantic segmentation of ultra-high-resolution (UHR) remote sensing imagery is critical for applications like environmental monitoring and urban planning but faces computational and optimization challenges. Conventional methods either lose fine details through downsampling or fragment global context via patch processing. While multi-branch networks address this trade-off, they suffer from computational inefficiency and conflicting gradient dynamics during training. We propose F2Net, a frequency-aware framework that decomposes UHR images into high- and low-frequency components for specialized processing. The high-frequency branch preserves full-resolution structural details, while the low-frequency branch processes downsampled inputs through dual sub-branches capturing short- and long-range dependencies. A Hybrid-Frequency Fusion module integrates these observations, guided by two novel objectives: Cross-Frequency Alignment Loss ensures semantic consistency between frequency components, and Cross-Frequency Balance Loss regulates gradient magnitudes across branches to stabilize training. Evaluated on DeepGlobe and Inria Aerial benchmarks, F2Net achieves state-of-the-art performance with mIoU of 80.22 and 83.39, respectively. Our code will be publicly available.
Abstract（参考訳）: 超高解像度(UHR)リモートセンシング画像のセマンティックセグメンテーションは、環境モニタリングや都市計画といった応用には重要であるが、計算と最適化の課題に直面している。従来の方法では、ダウンサンプリングやパッチ処理によるグローバルコンテキストの断片化によって詳細が失われる。マルチブランチネットワークはこのトレードオフに対処する一方で、計算の非効率さとトレーニング中の勾配ダイナミクスの矛盾に悩まされている。本稿では,UHR画像を高周波数成分と低周波数成分に分解して特殊な処理を行う周波数認識フレームワークF2Netを提案する。高周波分岐はフルレゾリューション構造の詳細を保存し、低周波数分岐は短距離および長距離の依存関係をキャプチャする2つのサブブランチを通してダウンサンプリングされた入力を処理する。クロス周波数アライメント損失は周波数コンポーネント間のセマンティック一貫性を保証する。 DeepGlobe と Inria Aerial のベンチマークで評価すると、F2Net は mIoU の 80.22 と 83.39 でそれぞれ最先端のパフォーマンスを達成した。私たちのコードは公開されます。

関連論文リスト

DSFC-Net: A Dual-Encoder Spatial and Frequency Co-Awareness Network for Rural Road Extraction [32.51260718935461]
本稿では,空間および周波数領域情報を融合するデュアルエンコーダフレームワークDSFC-Netを提案する。 CFIAモジュールはラプラシアピラミッド戦略を通じて、高周波数と低周波の情報を明示的に分離する。 WHU-RuR+、DeepGlobe、およびマサチューセッツのデータセットの実験は、最先端のアプローチよりもDSFC-Netの方が優れていることを検証した。
論文参考訳（メタデータ） (2026-02-01T15:23:42Z)
SONAR: Spectral-Contrastive Audio Residuals for Generalizable Deepfake Detection [6.042897432654865]
Spectral-cONtrastive Audio Residuals (AR)は、ディープフェイクオーディオ検出器のための周波数誘導フレームワークである。 ARは音声信号を補完表現に切り離す。 ASVspoof 2021およびin-the-wildベンチマークで評価した。
論文参考訳（メタデータ） (2025-11-26T12:16:38Z)
Frequency-Domain Decomposition and Recomposition for Robust Audio-Visual Segmentation [60.9960601057956]
本稿では2つの主要なモジュールからなる周波数対応オーディオ・ビジュアルコンポスタ(FAVS)フレームワークを紹介する。 FAVSフレームワークは、3つのベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-09-23T12:33:48Z)
Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文参考訳（メタデータ） (2025-08-07T11:14:16Z)
SPJFNet: Self-Mining Prior-Guided Joint Frequency Enhancement for Ultra-Efficient Dark Image Restoration [3.2735437407166414]
現在の暗黒画像復元法は、深刻な効率のボトルネックに悩まされている。本稿では,SPJFNetを用いた自己マイニング事前誘導型結合周波数拡張ネットワークを提案する。
論文参考訳（メタデータ） (2025-08-06T03:06:29Z)
Efficient Dual-domain Image Dehazing with Haze Prior Perception [17.18810808188725]
トランスフォーマーベースのモデルは、シングルイメージのデハージングにおいて強力なグローバルモデリング能力を示すが、その高い計算コストはリアルタイム適用性を制限する。そこで我々はDGFDNet(Dark Channel Guided Frequency-aware Dehazing Network)を提案する。 4つのベンチマークハウズデータセットの実験により、DGFDNetは、より優れた堅牢性とリアルタイム効率で最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-07-15T06:56:56Z)
FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文参考訳（メタデータ） (2025-06-17T02:33:42Z)
Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2025-05-25T12:23:10Z)
FreqU-FNet: Frequency-Aware U-Net for Imbalanced Medical Image Segmentation [0.0]
FreqU-FNetは周波数領域で動作する新しいU字型セグメンテーションアーキテクチャである。我々のフレームワークは、低パス畳み込みとDubechiesウェーブレットに基づくダウンサンプリングを利用する周波数を組み込んでいる。複数の医療セグメンテーションベンチマークの実験では、FreqU-FNetはCNNとTransformerのベースラインを一貫して上回っている。
論文参考訳（メタデータ） (2025-05-23T06:51:24Z)
FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [63.87313550399871]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。 PSTは、画像基礎モデルと潜在空間アライメントによるクロスモーダルな知識伝達を確立する。 FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
論文参考訳（メタデータ） (2025-03-25T15:04:53Z)
Deep Fourier-embedded Network for RGB and Thermal Salient Object Detection [8.607385112274882]
深層学習は、RGB画像と熱画像(RGB-T画像)を併用したサルエント物体検出(SOD)を大幅に改善した。既存のディープラーニングベースのRGB-T SODモデルには2つの大きな制限がある。本稿では,DFENet(Deep Fourier-Embedded Network)という,純粋なフーリエ変換モデルを提案する。
論文参考訳（メタデータ） (2024-11-27T14:55:16Z)
Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-03-27T14:25:52Z)
Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文参考訳（メタデータ） (2021-03-15T12:54:26Z)
Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文参考訳（メタデータ） (2020-10-12T16:50:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。