論文の概要: Insight Any Instance: Promptable Instance Segmentation for Remote Sensing Images
- arxiv url: http://arxiv.org/abs/2409.07022v1
- Date: Wed, 11 Sep 2024 05:31:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-12 15:36:35.541046
- Title: Insight Any Instance: Promptable Instance Segmentation for Remote Sensing Images
- Title(参考訳): Insight Any Instance: リモートセンシング画像のためのプロンプト可能なインスタンスセグメンテーション
- Authors: Xuexue Li,
- Abstract要約: リモートセンシング画像(RSI)のインスタンスセグメンテーションは、土地計画やインテリジェントトランスポートといった幅広い用途に欠かせない課題である。
ほとんどのインスタンスセグメンテーションモデルは、深い特徴学習に基づいており、複数のダウンサンプリングのような操作を含んでいる。
近年,視覚課題における即時学習の優れた性能に触発されて,上記の課題に対処する新たなプロンプトパラダイムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Instance segmentation of remote sensing images (RSIs) is an essential task for a wide range of applications such as land planning and intelligent transport. Instance segmentation of RSIs is constantly plagued by the unbalanced ratio of foreground and background and limited instance size. And most of the instance segmentation models are based on deep feature learning and contain operations such as multiple downsampling, which is harmful to instance segmentation of RSIs, and thus the performance is still limited. Inspired by the recent superior performance of prompt learning in visual tasks, we propose a new prompt paradigm to address the above issues. Based on the existing instance segmentation model, firstly, a local prompt module is designed to mine local prompt information from original local tokens for specific instances; secondly, a global-to-local prompt module is designed to model the contextual information from the global tokens to the local tokens where the instances are located for specific instances. Finally, a proposal's area loss function is designed to add a decoupling dimension for proposals on the scale to better exploit the potential of the above two prompt modules. It is worth mentioning that our proposed approach can extend the instance segmentation model to a promptable instance segmentation model, i.e., to segment the instances with the specific boxes prompt. The time consumption for each promptable instance segmentation process is only 40 ms. The paper evaluates the effectiveness of our proposed approach based on several existing models in four instance segmentation datasets of RSIs, and thorough experiments prove that our proposed approach is effective for addressing the above issues and is a competitive model for instance segmentation of RSIs.
- Abstract(参考訳): リモートセンシング画像(RSI)のインスタンスセグメンテーションは、土地計画やインテリジェントトランスポートといった幅広い用途に欠かせない課題である。
RSIのインスタンスセグメンテーションは、フォアグラウンドとバックグラウンドのバランスの取れない比率と限られたインスタンスサイズによって常に悩まされます。
そして、ほとんどのインスタンスセグメンテーションモデルは、深い機能学習に基づいており、複数のダウンサンプリングのような操作を含んでいる。
近年,視覚課題における即時学習の優れた性能に触発されて,上記の課題に対処する新たなプロンプトパラダイムを提案する。
既存のインスタンスセグメンテーションモデルに基づいて、まず、ローカルプロンプトモジュールが、元のローカルトークンから特定のインスタンスのローカルプロンプト情報をマイニングするように設計されている。
最後に、提案の領域損失関数は、上記の2つのプロンプトモジュールのポテンシャルをよりよく活用するために、提案のスケール上のデカップリング次元を追加するように設計されている。
提案したアプローチでは、インスタンスを特定のボックスプロンプトでセグメント化するために、インスタンスセグメンテーションモデルをプロンプト可能なインスタンスセグメンテーションモデルに拡張できることに注意する必要がある。
本稿では, RSIの4つのインスタンスセグメンテーションデータセットにおける既存モデルに基づく提案手法の有効性を評価するとともに, 提案手法が上記の問題に対処する上で有効であることを示すとともに, RSIのインスタンスセグメンテーションの競争モデルであることを示す。
関連論文リスト
- ISAR: A Benchmark for Single- and Few-Shot Object Instance Segmentation
and Re-Identification [24.709695178222862]
単発および少数発のオブジェクト識別のためのベンチマークおよびベースライン手法であるISARを提案する。
地層構造意味アノテーションを用いた半合成的ビデオシーケンスデータセットを提供する。
我々のベンチマークは、マルチオブジェクト追跡、ビデオオブジェクト、再識別の新たな研究動向と一致している。
論文 参考訳(メタデータ) (2023-11-05T18:51:33Z) - Lidar Panoptic Segmentation and Tracking without Bells and Whistles [48.078270195629415]
ライダーセグメンテーションと追跡のための検出中心ネットワークを提案する。
私たちのネットワークのコアコンポーネントの1つは、オブジェクトインスタンス検出ブランチです。
提案手法を複数の3D/4D LPSベンチマークで評価し,我々のモデルがオープンソースモデル間で新たな最先端性を確立することを確認した。
論文 参考訳(メタデータ) (2023-10-19T04:44:43Z) - PANet: LiDAR Panoptic Segmentation with Sparse Instance Proposal and
Aggregation [15.664835767712775]
この作業では、オフセットブランチへの依存性を排除するため、PANetという新しいLPSフレームワークを提案する。
PaNet はセマンティック KITII バリデーションと nuScenes バリデーションのパン光学セグメンテーションタスクに関する論文の中で,最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-06-27T10:02:28Z) - Active Pointly-Supervised Instance Segmentation [106.38955769817747]
アクティブポイント制御型インスタンスセグメンテーション(APIS)という,経済的なアクティブな学習環境を提案する。
APISはボックスレベルのアノテーションから始まり、ボックス内のポイントを反復的にサンプリングし、オブジェクトに落ちているかどうかを問う。
これらの戦略で開発されたモデルは、挑戦的なMS-COCOデータセットに対して一貫したパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2022-07-23T11:25:24Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - Target-Aware Object Discovery and Association for Unsupervised Video
Multi-Object Segmentation [79.6596425920849]
本稿では,教師なしビデオマルチオブジェクトセグメンテーションの課題について述べる。
より正確で効率的な時間区分のための新しいアプローチを紹介します。
DAVIS$_17$とYouTube-VISに対する提案手法を評価した結果,セグメント化精度と推論速度の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-04-10T14:39:44Z) - Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。
私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。
提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2020-07-13T11:03:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。