論文の概要: P2RBox: A Single Point is All You Need for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2311.13128v1
- Date: Wed, 22 Nov 2023 03:33:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 16:19:59.007049
- Title: P2RBox: A Single Point is All You Need for Oriented Object Detection
- Title(参考訳): P2RBox: オブジェクト指向オブジェクト検出に必要なポイントは1つ
- Authors: Guangming Cao, Xuehui Yu, Wenwen Yu, Xumeng Han, Xue Yang, Guorong Li,
Jianbin Jiao, Zhenjun Han
- Abstract要約: 我々はP2RBoxネットワークを導入し、ポイントアノテーションとマスクジェネレータを利用してマスクの提案を作成する。
高品質のマスクは、完全に監視された検出器を訓練するために回転したボックスアノテーションに変換される。
P2RBoxは、RetinaNet、Rotated FCOS、Oriented R-CNNという、完全に制御された3つのオブジェクト検出器とうまく機能する。
- 参考スコア(独自算出の注目度): 30.216854353102608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Oriented object detection, a specialized subfield in computer vision, finds
applications across diverse scenarios, excelling particularly when dealing with
objects of arbitrary orientations. Conversely, point annotation, which treats
objects as single points, offers a cost-effective alternative to rotated and
horizontal bounding boxes but sacrifices performance due to the loss of size
and orientation information. In this study, we introduce the P2RBox network,
which leverages point annotations and a mask generator to create mask
proposals, followed by filtration through our Inspector Module and Constrainer
Module. This process selects high-quality masks, which are subsequently
converted into rotated box annotations for training a fully supervised
detector. Specifically, we've thoughtfully crafted an Inspector Module rooted
in multi-instance learning principles to evaluate the semantic score of masks.
We've also proposed a more robust mask quality assessment in conjunction with
the Constrainer Module. Furthermore, we've introduced a Symmetry Axis
Estimation (SAE) Module inspired by the spectral theorem for symmetric matrices
to transform the top-performing mask proposal into rotated bounding boxes.
P2RBox performs well with three fully supervised rotated object detectors:
RetinaNet, Rotated FCOS, and Oriented R-CNN. By combining with Oriented R-CNN,
P2RBox achieves 62.26% on DOTA-v1.0 test dataset. As far as we know, this is
the first attempt at training an oriented object detector with point
supervision.
- Abstract(参考訳): オブジェクト指向物体検出(Oriented Object Detection)は、コンピュータビジョンの特殊なサブフィールドであり、様々なシナリオにまたがるアプリケーションを見つけ出す。
逆に、オブジェクトを単一ポイントとして扱うポイントアノテーションは、回転と水平のバウンディングボックスに代わるコスト効率のよい代替手段を提供するが、サイズや方向情報の喪失によりパフォーマンスを犠牲にする。
本研究では,点アノテーションとマスク生成器を用いてマスク提案を作成し,インスペクタモジュールと制約モジュールを通したフィルタリングを行うp2rboxネットワークを提案する。
このプロセスは高品質のマスクを選択し、その後完全に監督された検出器を訓練するために回転箱アノテーションに変換される。
具体的には、マスクの意味スコアを評価するために、マルチインスタンス学習原則に根ざしたインスペクタモジュールを慎重に作成しました。
また、Constrainer Moduleとともに、より堅牢なマスク品質評価も提案しました。
さらに、対称行列のスペクトル定理にインスパイアされた対称性軸推定(SAE)モジュールを導入し、トップパフォーマンスマスクの提案を回転バウンディングボックスに変換する。
P2RBoxは、RetinaNet、Rotated FCOS、Oriented R-CNNという、完全に制御された3つのオブジェクト検出器とうまく機能する。
Oriented R-CNNと組み合わせることで、P2RBoxはDOTA-v1.0テストデータセットで62.26%を達成した。
我々の知る限り、これは指向した物体検出器を点監視で訓練する最初の試みである。
関連論文リスト
- Point2RBox: Combine Knowledge from Synthetic Visual Patterns for
End-to-end Oriented Object Detection with Single Point Supervision [80.386636238141]
本稿では,ポイント教師付きオブジェクト検出のためのPoint2RBoxという手法を提案する。
提案手法は軽量なパラダイムを用いているが,点教師付き代替品間での競合性能を実現する。
特に,本手法は軽量なパラダイムを用いるが,点教師付き代替品間での競合性能を実現する。
論文 参考訳(メタデータ) (2023-11-23T15:57:41Z) - Box2Mask: Box-supervised Instance Segmentation via Level-set Evolution [38.88010537144528]
本稿では,Box2Maskという新しい単一ショットインスタンスセグメンテーション手法を提案する。
Box2Maskは、古典的なレベルセット進化モデルとディープニューラルネットワーク学習を統合して、バウンディングボックスの監督のみで正確なマスク予測を実現する。
論文 参考訳(メタデータ) (2022-12-03T09:32:14Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - H2RBox: Horizonal Box Annotation is All You Need for Oriented Object
Detection [63.66553556240689]
オブジェクト指向物体検出は、空中画像から自律運転に至るまで、多くの用途に現れる。
多くの既存の検出ベンチマークには水平バウンディングボックスがアノテートされているが、これはきめ細かな回転ボックスよりもコストが低い。
本稿では,H2RBoxと呼ばれる単純なオブジェクト指向検出手法を提案する。
論文 参考訳(メタデータ) (2022-10-13T05:12:45Z) - Point-to-Box Network for Accurate Object Detection via Single Point
Supervision [51.95993495703855]
オフ・ザ・シェルフ提案法(OTSP)の軽量な代替手法を提案する。
P2BNetは、アンカーのような方法で提案を生成することで、オブジェクト間のバランスの取れた提案バッグを構築することができる。
コードはCOCO.com/ucas-vg/P2BNetでリリースされる。
論文 参考訳(メタデータ) (2022-07-14T11:32:00Z) - Towards Robust Video Object Segmentation with Adaptive Object
Calibration [18.094698623128146]
ビデオオブジェクトセグメンテーション(VOS)は、参照フレームの注釈付きオブジェクトマスクを与えられたビデオのすべてのターゲットフレームにおけるオブジェクトのセグメンテーションを目的としている。
本稿では,オブジェクト表現を適応的に構築し,オブジェクトマスクを校正して強靭性を実現する,新しいディープネットワークを提案する。
本モデルは,既存の出版作品の最先端性能を達成し,摂動に対する優れた堅牢性を示す。
論文 参考訳(メタデータ) (2022-07-02T17:51:29Z) - BoxeR: Box-Attention for 2D and 3D Transformers [36.03241565421038]
入力特徴写像上の参照ウィンドウからの変換を予測し,ボックスの集合に付随するボックストランスフォーマーの略であるBoxeRを提案する。
BoxeR-2Dはそのアテンションモジュール内のボックス情報を自然に理由付け、エンドツーエンドのインスタンス検出とセグメンテーションタスクに適している。
BoxeR-3Dは、鳥眼面から識別情報を生成し、3Dのエンドツーエンド物体検出を行う。
論文 参考訳(メタデータ) (2021-11-25T13:54:25Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Geometry Constrained Weakly Supervised Object Localization [55.17224813345206]
弱教師付きオブジェクトローカライゼーションのための幾何制約付きネットワークであるGC-Netを提案する。
検出器は、幾何学的形状を記述する係数の集合によって定義された物体の位置を予測する。
ジェネレータは、得られたマスクされた画像を入力として、オブジェクトとバックグラウンドの2つの補完的な分類タスクを実行する。
従来のアプローチとは対照的に、GC-Netはエンドツーエンドでトレーニングされ、後処理なしでオブジェクトの位置を予測する。
論文 参考訳(メタデータ) (2020-07-19T17:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。