論文の概要: SFR-Net: Learning Scale-Frustum Representations for Ultra-Wide Area Remote Sensing Image Segmentation
- arxiv url: http://arxiv.org/abs/2605.25737v1
- Date: Mon, 25 May 2026 11:45:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.84652
- Title: SFR-Net: Learning Scale-Frustum Representations for Ultra-Wide Area Remote Sensing Image Segmentation
- Title(参考訳): SFR-Net:超広帯域リモートセンシング画像セグメンテーションのためのスケールフラストレーションの学習
- Authors: Chuyu Zhong, Keyan Chen, Qinzhe Yang, Bowen Chen, Zhengxia Zou, Zhenwei Shi,
- Abstract要約: 本稿では,UWA(Ultra-wide Area)リモートセンシング画像を対象とした新しいセグメンテーションタスクを提案する。
本稿では,UWAセグメンテーションの課題に対処するため,SFR-Net(Scale-Frustum Representation Network)を提案する。
SFR-Netは最先端のパフォーマンスを実現し、mIoUを1.72%改善し、4.29%改善した。
- 参考スコア(独自算出の注目度): 35.92745600073289
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pixel count and geographical coverage are two key characteristics of remote sensing images. Existing remote sensing image segmentation methods typically focus on images with either a small pixel count or a large pixel count but limited geographical coverage. In this paper, we introduce a novel segmentation task targeting ultra-wide area (UWA) remote sensing images, characterized by both a large pixel count and extremely wide geographical coverage. The core challenges of UWA segmentation lie in simultaneously handling ground objects with significantly varying scales and maintaining long-range contextual semantic continuity. To address these challenges, we propose the Scale-Frustum Representation Network (SFR-Net). Inspired by the viewing frustums of remote sensing images captured from different altitudes, we construct scale-frustum representations, enabling unified modeling of ground objects and contextual features at different scales. Furthermore, we design a cascaded cross-scale fusion mechanism to effectively integrate these representations, enhancing local semantic understanding while ensuring long-range contextual continuity. Experimental results on GID and FBPS demonstrate that SFR-Net achieves state-of-the-art performance, improving mIoU by 1.72% and 4.29%, respectively, over the strongest competing methods. In addition, the proposed scale-frustum representations can be integrated into generic segmentation networks to improve both segmentation accuracy and convergence speed. The implementation code will be publicly available at https://github.com/ChuyuZhong/SFR-Net.
- Abstract(参考訳): リモートセンシング画像の2つの重要な特徴は、画素数と地理的カバレッジである。
既存のリモートセンシング画像分割法は、通常、小さなピクセル数または大きなピクセル数を持つ画像に焦点を当てるが、地理的範囲は限られている。
本稿では,UWA(Ultra-wide Area)リモートセンシング画像を対象とした新たなセグメンテーションタスクを提案する。
UWAセグメンテーションの中核となる課題は、異なるスケールのグラウンドオブジェクトを同時に扱うことと、長距離のコンテキストセマンティックな連続性を維持することである。
これらの課題に対処するため,SFR-Net(Scale-Frustum Representation Network)を提案する。
異なる高度から捉えたリモートセンシング画像のフラストムの観察に触発されて、スケール・フラストム表現を構築し、異なるスケールで地上オブジェクトとコンテキスト特徴の統一的なモデリングを可能にする。
さらに,これらの表現を効果的に統合し,長期的文脈連続性を確保しつつ,局所的意味理解の強化を図るため,ケースケード型クロススケール融合機構を設計する。
GIDとFBPSの実験結果は、SFR-Netが最先端の性能を達成し、mIoUをそれぞれ1.72%改善し、4.29%改善したことを示している。
さらに,提案するスケールフラストム表現を汎用セグメンテーションネットワークに統合することで,セグメンテーション精度と収束速度の両方を改善することができる。
実装コードはhttps://github.com/ChuyuZhong/SFR-Netで公開される。
関連論文リスト
- G2HFNet: GeoGran-Aware Hierarchical Feature Fusion Network for Salient Object Detection in Optical Remote Sensing Images [76.1829298714382]
既存の手法では、一様注意機構を用いて複数の特徴を単一スケールで抽出するのが一般的である。
光リモートセンシング画像における幾何的および粒度をフル活用するGeoGran-Aware grained Feature Fusion Network (G2HFNet)を提案する。
論文 参考訳(メタデータ) (2026-03-13T05:52:00Z) - GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - SDRNET: Stacked Deep Residual Network for Accurate Semantic Segmentation of Fine-Resolution Remotely Sensed Images [12.225954818454724]
高解像度リモートセンシング画像のセマンティックセグメンテーションから生成されたランドカバーマップは、ミューコンを描画した。
本稿では、FRRS画像からのセマンティックセグメンテーションのためのスタックドディープ残差ネットワーク(SDRNet)を提案する。
論文 参考訳(メタデータ) (2025-06-27T06:40:30Z) - DeepMerge: Deep-Learning-Based Region-Merging for Image Segmentation [7.063322114865965]
本稿では,DeepMergeと呼ばれる深層学習に基づく領域マージ手法を提案する。
これは、ディープラーニングを用いて類似性を学習し、RAGに隣接する類似のスーパーピクセルをマージする最初の方法である。
DeepMergeは最も高いF値(0.9550)と最も低い総誤差TE(0.0895)を達成し、異なるサイズのオブジェクトを正しく分割し、競合する全てのセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2023-05-31T12:27:58Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。