論文の概要: P2RBox: Point Prompt Oriented Object Detection with SAM
- arxiv url: http://arxiv.org/abs/2311.13128v2
- Date: Thu, 23 May 2024 15:18:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-26 20:04:03.374359
- Title: P2RBox: Point Prompt Oriented Object Detection with SAM
- Title(参考訳): P2RBox:SAMによるポイントプロンプト指向オブジェクト検出
- Authors: Guangming Cao, Xuehui Yu, Wenwen Yu, Xumeng Han, Xue Yang, Guorong Li, Jianbin Jiao, Zhenjun Han,
- Abstract要約: 我々はP2RBoxを紹介した。これはオブジェクト指向オブジェクト検出のための回転ボックス(RBox)アノテーションを生成するためにポイントプロンプトを利用する。
P2RBoxには、境界感性マスクガイダンスと、空間情報を利用して粒度のあいまいさを低減する中心性ガイダンスという、2つの先進的なガイダンスが組み込まれている。
最先端のポイントアノテート生成手法であるPointOBBと比較すると、P2RBoxはDOTA-v1.0データセット上で約29%のmAPで性能が向上する。
- 参考スコア(独自算出の注目度): 28.96914721062631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-point annotation in oriented object detection of remote sensing scenarios is gaining increasing attention due to its cost-effectiveness. However, due to the granularity ambiguity of points, there is a significant performance gap between previous methods and those with fully supervision. In this study, we introduce P2RBox, which employs point prompt to generate rotated box (RBox) annotation for oriented object detection. P2RBox employs the SAM model to generate high-quality mask proposals. These proposals are then refined using the semantic and spatial information from annotation points. The best masks are converted into oriented boxes based on the feature directions suggested by the model. P2RBox incorporates two advanced guidance cues: Boundary Sensitive Mask guidance, which leverages semantic information, and Centrality guidance, which utilizes spatial information to reduce granularity ambiguity. This combination enhances detection capabilities significantly. To demonstrate the effectiveness of this method, enhancements based on the baseline were observed by integrating three different detectors. Furthermore, compared to the state-of-the-art point-annotated generative method PointOBB, P2RBox outperforms by about 29% mAP (62.43% vs 33.31%) on DOTA-v1.0 dataset, which provides possibilities for the practical application of point annotations.
- Abstract(参考訳): リモートセンシングシナリオのオブジェクト指向オブジェクト検出における単一点アノテーションは,コスト効率のため注目度が高まっている。
しかし、点の粒度のあいまいさのため、従来の方法と完全に監督された方法との間には大きな性能差がある。
本研究では,P2RBoxを導入し,オブジェクト指向オブジェクト検出のための回転ボックス(RBox)アノテーションを生成する。
P2RBoxはSAMモデルを使用して高品質なマスクの提案を生成する。
これらの提案はアノテーションポイントからの意味情報と空間情報を用いて洗練される。
最高のマスクは、モデルによって提案される特徴方向に基づいて、配向ボックスに変換される。
P2RBoxには、意味情報を活用する境界感性マスクガイダンスと、空間情報を利用して粒度のあいまいさを低減する中心性ガイダンスの2つの先進的なガイダンスが組み込まれている。
この組み合わせは検出能力を著しく向上させる。
本手法の有効性を実証するために, 3種類の検出器を統合することにより, ベースラインに基づく改良が観察された。
さらに、最先端のポイントアノテート生成法であるPointOBBと比較して、P2RBoxはDOTA-v1.0データセット上で約29%のmAP(62.43%対33.31%)で性能が向上し、ポイントアノテーションの実用的な適用の可能性を提供している。
関連論文リスト
- Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision [81.60564776995682]
我々は、ポイント教師付きオブジェクト検出のためのエンドツーエンドソリューションであるPoint2RBoxを提案する。
提案手法は軽量なパラダイムを用いているが,点教師付き代替品間での競合性能を実現する。
特に,本手法は軽量なパラダイムを用いるが,点教師付き代替品間での競合性能を実現する。
論文 参考訳(メタデータ) (2023-11-23T15:57:41Z) - H2RBox: Horizonal Box Annotation is All You Need for Oriented Object
Detection [63.66553556240689]
オブジェクト指向物体検出は、空中画像から自律運転に至るまで、多くの用途に現れる。
多くの既存の検出ベンチマークには水平バウンディングボックスがアノテートされているが、これはきめ細かな回転ボックスよりもコストが低い。
本稿では,H2RBoxと呼ばれる単純なオブジェクト指向検出手法を提案する。
論文 参考訳(メタデータ) (2022-10-13T05:12:45Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - Point-to-Box Network for Accurate Object Detection via Single Point
Supervision [51.95993495703855]
オフ・ザ・シェルフ提案法(OTSP)の軽量な代替手法を提案する。
P2BNetは、アンカーのような方法で提案を生成することで、オブジェクト間のバランスの取れた提案バッグを構築することができる。
コードはCOCO.com/ucas-vg/P2BNetでリリースされる。
論文 参考訳(メタデータ) (2022-07-14T11:32:00Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Oriented RepPoints for Aerial Object Detection [10.818838437018682]
本稿では,オブジェクト指向RepPointsという,空中物体検出のための新しい手法を提案する。
具体的には、任意指向オブジェクトの幾何学的および空間的情報を取得するために、適応点の集合を用いることを提案する。
教師付き学習を容易にするために,適応点を配向境界ボックスに明示的にマッピングする指向変換関数を提案する。
論文 参考訳(メタデータ) (2021-05-24T06:18:23Z) - SIENet: Spatial Information Enhancement Network for 3D Object Detection
from Point Cloud [20.84329063509459]
LiDARベースの3Dオブジェクト検出は、自動運転車に大きな影響を与える。
LiDARの固有特性の制限により、センサーから遠く離れた物体において、より少ない点が収集される。
そこで本研究では,SIENetという2段階の3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-29T07:45:09Z) - Cross-Modality 3D Object Detection [63.29935886648709]
本稿では,3次元物体検出のための新しい2段階多モード融合ネットワークを提案する。
アーキテクチャ全体が2段階の融合を促進する。
KITTIデータセットを用いた実験により,提案したマルチステージ融合により,ネットワークがより良い表現を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-08-16T11:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。