論文の概要: RS-ISRefiner: Towards Better Adapting Vision Foundation Models for Interactive Segmentation of Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2512.00718v1
- Date: Sun, 30 Nov 2025 04:12:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.380409
- Title: RS-ISRefiner: Towards Better Adapting Vision Foundation Models for Interactive Segmentation of Remote Sensing Images
- Title(参考訳): RS-ISRefiner:リモートセンシング画像の対話的セグメンテーションのための視覚基礎モデルの改良を目指して
- Authors: Deliang Wang, Peng Liu,
- Abstract要約: RS-ISRefinerは、リモートセンシング画像に適したクリックベースのIISフレームワークである。
セグメンテーション精度、効率、相互作用コストの点で、最先端IIS法を一貫して上回っている。
- 参考スコア(独自算出の注目度): 17.648922817109224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive image segmentation(IIS) plays a critical role in generating precise annotations for remote sensing imagery, where objects often exhibit scale variations, irregular boundaries and complex backgrounds. However, existing IIS methods, primarily designed for natural images, struggle to generalize to remote sensing domains due to limited annotated data and computational overhead. To address these challenges, we proposed RS-ISRefiner, a novel click-based IIS framework tailored for remote sensing images. The framework employs an adapter-based tuning strategy that preserves the general representations of Vision Foundation Models while enabling efficient learning of remote sensing-specific spatial and boundary characteristics. A hybrid attention mechanism integrating convolutional local modeling with Transformer-based global reasoning enhances robustness against scale diversity and scene complexity. Furthermore, an improved probability map modulation scheme effectively incorporates historical user interactions, yielding more stable iterative refinement and higher boundary fidelity. Comprehensive experiments on six remote sensing datasets, including iSAID, ISPRS Potsdam, SandBar, NWPU, LoveDA Urban and WHUBuilding, demonstrate that RS-ISRefiner consistently outperforms state-of-the-art IIS methods in terms of segmentation accuracy, efficiency and interaction cost. These results confirm the effectiveness and generalizability of our framework, making it highly suitable for high-quality instance segmentation in practical remote sensing scenarios.
- Abstract(参考訳): インタラクティブ画像セグメンテーション(IIS)は、リモートセンシング画像の正確なアノテーションを生成する上で重要な役割を担っている。
しかし、既存のIIS法は主に自然画像用に設計されており、限られた注釈付きデータと計算オーバーヘッドのため、リモートセンシング領域への一般化に苦慮している。
これらの課題に対処するため,我々は,リモートセンシング画像に適した新しいクリックベースIISフレームワークであるRS-ISRefinerを提案する。
このフレームワークは、リモートセンシング特有の空間および境界特性の効率的な学習を可能にしながら、Vision Foundation Modelsの一般的な表現を保存するアダプタベースのチューニング戦略を採用している。
Transformerをベースとしたグローバル推論と畳み込み局所モデリングを統合したハイブリッドアテンション機構は、スケールの多様性とシーンの複雑さに対する堅牢性を高める。
さらに、改良された確率マップ変調方式は、歴史的ユーザインタラクションを効果的に取り入れ、より安定した反復洗練とより高い境界忠実性をもたらす。
iSAID、ISPRS Potsdam、SandBar、NWPU、LoveDA Urban、WHUBuildingを含む6つのリモートセンシングデータセットに関する総合的な実験は、RS-ISRefinerがセグメンテーション精度、効率、相互作用コストの点で、最先端IISメソッドを一貫して上回っていることを実証している。
これらの結果は,本フレームワークの有効性と一般化性を確認し,実用的なリモートセンシングシナリオにおける高品質なインスタンスセグメンテーションに極めて適している。
関連論文リスト
- GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。