論文の概要: DB SwinT: A Dual-Branch Swin Transformer Network for Road Extraction in Optical Remote Sensing Imagery
- arxiv url: http://arxiv.org/abs/2603.24005v1
- Date: Wed, 25 Mar 2026 07:08:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.176187
- Title: DB SwinT: A Dual-Branch Swin Transformer Network for Road Extraction in Optical Remote Sensing Imagery
- Title(参考訳): DB SwinT:光リモートセンシング画像における道路抽出のためのデュアルブランチスウィントランスネットワーク
- Authors: Zongyang He, Xiangli Yang, Xian Gao, Zhiguo Wang,
- Abstract要約: 本稿では,道路抽出のためのDual-Branch Swin Transformer Network (DB SwinT)を提案する。
提案フレームワークは,Swin Transformerの長距離依存性モデリング機能とU-Netのマルチスケール機能融合戦略を組み合わせたものである。
マサチューセッツとDeepGlobeのデータセットの実験結果は、DB SwinTがそれぞれ79.35%と74.84%のIoU(Intersection over Union)を達成していることを示している。
- 参考スコア(独自算出の注目度): 19.2219460380897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the continuous improvement in the spatial resolution of optical remote sensing imagery, accurate road extraction has become increasingly important for applications such as urban planning, traffic monitoring, and disaster management. However, road extraction in complex urban and rural environments remains challenging, as roads are often occluded by trees, buildings, and other objects, leading to fragmented structures and reduced extraction accuracy. To address this problem, this paper proposes a Dual-Branch Swin Transformer network (DB SwinT) for road extraction. The proposed framework combines the long-range dependency modeling capability of the Swin Transformer with the multi-scale feature fusion strategy of U-Net, and employs a dual-branch encoder to learn complementary local and global representations. Specifically, the local branch focuses on recovering fine structural details in occluded areas, while the global branch captures broader semantic context to preserve the overall continuity of road networks. In addition, an Attentional Feature Fusion (AFF) module is introduced to adaptively fuse features from the two branches, further enhancing the representation of occluded road segments. Experimental results on the Massachusetts and DeepGlobe datasets show that DB SwinT achieves Intersection over Union (IoU) scores of 79.35\% and 74.84\%, respectively, demonstrating its effectiveness for road extraction from optical remote sensing imagery.
- Abstract(参考訳): 光リモートセンシング画像の空間分解能の継続的な改善により、都市計画、交通監視、災害管理などの応用において、正確な道路抽出がますます重要になっている。
しかし、複雑な都市や農村環境における道路の抽出は困難であり、道路は木や建物、その他の物体によって遮られ、断片化された構造となり、抽出精度が低下する。
そこで本研究では,道路抽出のためのDual-Branch Swin Transformer Network (DB SwinT)を提案する。
提案フレームワークは,Swin Transformerの長距離依存性モデリング機能とU-Netのマルチスケール機能融合戦略を組み合わせて,補完的な局所およびグローバル表現の学習にデュアルブランチエンコーダを用いる。
具体的には,道路網の全体的連続性を維持するために,グローバルブランチがより広い意味的コンテキストを捉えているのに対して,ローカルブランチは閉鎖された領域における微細な構造的詳細の回復に重点を置いている。
さらに,2つの分岐から特徴を適応的に融合させるために,AFFモジュールを導入し,閉塞道路セグメントの表現をさらに強化する。
マサチューセッツとDeepGlobeのデータセットの実験結果から、DB SwinTは、それぞれ79.35\%と74.84\%のIoU(Intersection over Union)スコアを達成し、光学リモートセンシング画像からの道路抽出の有効性を示した。
関連論文リスト
- D3FNet: A Differential Attention Fusion Network for Fine-Grained Road Structure Extraction in Remote Perception Systems [5.350820088672045]
D3FNet(D3FNet)は、リモート認識システムにおける微粒な道路構造セグメンテーションのために設計されたD3FNet(Dual-Stream Differential Attention Fusion Network)である。
DADEモジュールは、ボトルネック時のバックグラウンドノイズを抑制しながら、微妙な道路特性を向上する。
DDFMは、空間的精度と意味的文脈のバランスをとるために、オリジナルとアテンションを変調した特徴を統合している。
論文 参考訳(メタデータ) (2025-08-21T13:12:20Z) - Holistically-Nested Structure-Aware Graph Neural Network for Road Extraction [6.537257686406911]
本稿では,道路領域と道路境界の両方を同時に検出する新しいグラフニューラルネットワーク(GNN)を提案する。
挑戦的データセットの実験により,提案手法が道路境界のデライン化と道路抽出精度を向上させることを示す。
論文 参考訳(メタデータ) (2024-07-02T20:11:09Z) - Fine-Grained Extraction of Road Networks via Joint Learning of
Connectivity and Segmentation [5.496893845821393]
衛星画像からの道路網抽出は、インテリジェントな交通管理と自動運転分野に広く応用されている。
高解像度のリモートセンシング画像は複雑な道路エリアと背景を逸脱させており,道路抽出の課題となっている。
接続の正しさを保ちながら、エンドツーエンドのセグメンテーション道路のためのスタック型マルチタスクネットワークを提案する。
論文 参考訳(メタデータ) (2023-12-07T22:57:17Z) - Aerial Images Meet Crowdsourced Trajectories: A New Approach to Robust
Road Extraction [110.61383502442598]
我々は、Cross-Modal Message Propagation Network (CMMPNet)と呼ばれる新しいニューラルネットワークフレームワークを紹介する。
CMMPNetは、モダリティ固有の表現学習のための2つのディープオートエンコーダと、クロスモーダル表現洗練のためのテーラー設計のデュアルエンハンスメントモジュールで構成されている。
実世界の3つのベンチマーク実験により, CMMPNetによる堅牢な道路抽出の有効性が示された。
論文 参考訳(メタデータ) (2021-11-30T04:30:10Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - Transformer Meets Convolution: A Bilateral Awareness Net-work for
Semantic Segmentation of Very Fine Resolution Ur-ban Scene Images [6.460167724233707]
本稿では,依存経路とテクスチャパスを含む相互認知ネットワーク(BANet)を提案する。
BANetは、VFR画像の長距離関係と細かな詳細をキャプチャする。
3つの大規模都市景観画像セグメンテーションデータセット(ISPRS Vaihingen データセット、ISPRS Potsdam データセット、UAVid データセット)で実施された実験は、BANetの有効性を実証している。
論文 参考訳(メタデータ) (2021-06-23T13:57:36Z) - Convolutional Recurrent Network for Road Boundary Extraction [99.55522995570063]
我々は,LiDARとカメラ画像からの道路境界抽出の問題に取り組む。
我々は,完全畳み込みネットワークが道路境界の位置と方向をエンコードする深い特徴量を得る構造化モデルを設計する。
北米の大都市において,道路境界の完全なトポロジを99.3%の時間で得られる方法の有効性を示す。
論文 参考訳(メタデータ) (2020-12-21T18:59:12Z) - Promoting Connectivity of Network-Like Structures by Enforcing Region
Separation [101.10228007363673]
本稿では,ネットワークのような構造を再構築するために,深い畳み込みネットワークをトレーニングするための接続性指向の損失関数を提案する。
私たちの喪失の背後にある主な考え方は、画像の背景領域間で発生する断線の観点から、道路や運河の接続性を表現することです。
2つの標準的な道路ベンチマークと、新しい灌水用運河のデータセットの実験において、損失関数で訓練されたコンブネットが道路接続を回復できることが示されている。
論文 参考訳(メタデータ) (2020-09-15T12:21:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。