論文の概要: DSFC-Net: A Dual-Encoder Spatial and Frequency Co-Awareness Network for Rural Road Extraction
- arxiv url: http://arxiv.org/abs/2602.01278v1
- Date: Sun, 01 Feb 2026 15:23:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.692203
- Title: DSFC-Net: A Dual-Encoder Spatial and Frequency Co-Awareness Network for Rural Road Extraction
- Title(参考訳): DSFC-Net:農村道路抽出のためのデュアルエンコーダ空間・周波数共認識ネットワーク
- Authors: Zhengbo Zhang, Yihe Tian, Wanke Xia, Lin Chen, Yue Sun, Kun Ding, Ying Wang, Bing Xu, Shiming Xiang,
- Abstract要約: 本稿では,空間および周波数領域情報を融合するデュアルエンコーダフレームワークDSFC-Netを提案する。
CFIAモジュールはラプラシアピラミッド戦略を通じて、高周波数と低周波の情報を明示的に分離する。
WHU-RuR+、DeepGlobe、およびマサチューセッツのデータセットの実験は、最先端のアプローチよりもDSFC-Netの方が優れていることを検証した。
- 参考スコア(独自算出の注目度): 32.51260718935461
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate extraction of rural roads from high-resolution remote sensing imagery is essential for infrastructure planning and sustainable development. However, this task presents unique challenges in rural settings due to several factors. These include high intra-class variability and low inter-class separability from diverse surface materials, frequent vegetation occlusions that disrupt spatial continuity, and narrow road widths that exacerbate detection difficulties. Existing methods, primarily optimized for structured urban environments, often underperform in these scenarios as they overlook such distinctive characteristics. To address these challenges, we propose DSFC-Net, a dual-encoder framework that synergistically fuses spatial and frequency-domain information. Specifically, a CNN branch is employed to capture fine-grained local road boundaries and short-range continuity, while a novel Spatial-Frequency Hybrid Transformer (SFT) is introduced to robustly model global topological dependencies against vegetation occlusions. Distinct from standard attention mechanisms that suffer from frequency bias, the SFT incorporates a Cross-Frequency Interaction Attention (CFIA) module that explicitly decouples high- and low-frequency information via a Laplacian Pyramid strategy. This design enables the dynamic interaction between spatial details and frequency-aware global contexts, effectively preserving the connectivity of narrow roads. Furthermore, a Channel Feature Fusion Module (CFFM) is proposed to bridge the two branches by adaptively recalibrating channel-wise feature responses, seamlessly integrating local textures with global semantics for accurate segmentation. Comprehensive experiments on the WHU-RuR+, DeepGlobe, and Massachusetts datasets validate the superiority of DSFC-Net over state-of-the-art approaches.
- Abstract(参考訳): 高解像度リモートセンシング画像からの農村道路の正確な抽出は、インフラ計画と持続可能な開発に不可欠である。
しかし, この課題はいくつかの要因から, 農村環境に固有の課題をもたらす。
これらには、様々な表面材料からの高いクラス内変動とクラス間分離性、空間的連続性を阻害する頻繁な植生閉塞、検出困難を悪化させる狭い道路幅が含まれる。
既存の手法は主に都市環境に最適化されており、これらのシナリオではそのような特徴を見落としているため、性能が劣ることが多い。
これらの課題に対処するために,空間および周波数領域情報を相乗的に融合するデュアルエンコーダフレームワークDSFC-Netを提案する。
具体的には、CNNブランチを使用して、細粒な局所道路境界と短距離連続性を捕捉し、新しい空間周波数ハイブリッドトランス(SFT)を導入して、植生閉塞に対するグローバルなトポロジ的依存関係を堅牢にモデル化する。
周波数バイアスに苦しむ標準的な注意機構とは別として、SFTはラプラシアンピラミッド戦略を通じて、高頻度および低周波情報を明示的に分離するCFIAモジュールを組み込んでいる。
この設計により、狭い道路の接続性を効果的に保ちながら、空間的詳細と周波数対応のグローバルコンテキストの動的相互作用を可能にする。
さらに,チャネル機能融合モジュール (CFFM) を提案し, チャネル機能応答を適応的に調整し, 局所テクスチャをグローバルなセグメンテーションとシームレスに統合し, 正確なセグメンテーションを行う。
WHU-RuR+、DeepGlobe、およびマサチューセッツのデータセットに関する包括的な実験は、最先端のアプローチよりもDSFC-Netの方が優れていることを検証している。
関連論文リスト
- Fluxamba: Topology-Aware Anisotropic State Space Models for Geological Lineament Segmentation in Multi-Source Remote Sensing [6.815807403335458]
トポロジ対応の機能修正フレームワークを導入した軽量アーキテクチャを提案する。
F Fluxambaは3.4Mパラメータと6.3G FLOPで24FPS以上のリアルタイム推論速度を達成する。
論文 参考訳(メタデータ) (2026-01-24T03:55:21Z) - MFC-RFNet: A Multi-scale Guided Rectified Flow Network for Radar Sequence Prediction [7.015114232190396]
レーダエコーシークエンスからの正確な高分解能降水は、災害軽減と経済計画に不可欠である。
鍵となる課題は、複雑なマルチスケール進化のモデル化、変位に起因するフレーム間特徴の不整合、長距離コンテキストの効率的なキャプチャである。
本稿では,MFRF-Net(Multiscale Feature Communication Rectified Flow Network)を提案する。
論文 参考訳(メタデータ) (2026-01-07T06:24:26Z) - CoCo-Fed: A Unified Framework for Memory- and Communication-Efficient Federated Learning at the Wireless Edge [50.42067935605982]
ローカルメモリの効率とグローバル通信の削減を両立させる新しい圧縮・結合型学習フレームワークを提案する。
CoCo-Fedは、メモリと通信効率の両方において最先端のベースラインを著しく上回り、非IID設定下では堅牢な収束を維持している。
論文 参考訳(メタデータ) (2026-01-02T03:39:50Z) - Real-Time LiDAR Super-Resolution via Frequency-Aware Multi-Scale Fusion [0.4078247440919472]
FLASH (Frequency-aware LiDAR Adaptive Super- resolution with Hierarchical fusion) は、二重ドメイン処理による制限を克服する新しいフレームワークである。
FLASHは、2つの重要なイノベーションを統合する: (i) 局所的な空間的注意とFFTによるグローバルな周波数領域分析を組み合わせ、細粒度の幾何と周期的な走査パターンの両方をログ線形複雑度で捉え、 (ii) 学習された位置特異的な特徴集約による従来のスキップ接続を置き換え、CBAMによる動的特徴選択のために強化する適応的マルチスケールフュージョン。
論文 参考訳(メタデータ) (2025-11-10T18:38:15Z) - Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。
既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。
本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文 参考訳(メタデータ) (2025-08-07T11:14:16Z) - SWAN: Synergistic Wavelet-Attention Network for Infrared Small Target Detection [8.098063209250684]
赤外線小目標検出(IRSTD)は、民間および軍事用途において重要である。
近年の手法は局所的な空間パターンを主に捉えた従来の畳み込み処理に重点を置いている。
空間領域と周波数領域の両方からターゲットを知覚する新しいフレームワークであるSynergistic Wavelet-Attention Network (SWAN)を提案する。
論文 参考訳(メタデータ) (2025-08-02T11:26:58Z) - FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation [10.67983913373955]
F2Netは、UHR画像を特殊な処理のために高周波数成分と低周波数成分に分解する周波数認識フレームワークである。
ハイブリッド周波数融合モジュールは、2つの新しい目的によって導かれるこれらの観測を統合する。
F2Netは、それぞれ80.22のmIoUと83.39の最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-06-09T15:09:49Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - Accelerated Multi-Contrast MRI Reconstruction via Frequency and Spatial Mutual Learning [50.74383395813782]
本稿では,周波数・空間相互学習ネットワーク(FSMNet)を提案する。
提案したFSMNetは, 加速度係数の異なるマルチコントラストMR再構成タスクに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-09-21T12:02:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。