論文の概要: Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision
- arxiv url: http://arxiv.org/abs/2311.14758v2
- Date: Thu, 21 Mar 2024 12:43:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-22 19:47:00.236858
- Title: Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision
- Title(参考訳): Point2RBox: エンドツーエンドオブジェクト指向オブジェクト検出のための合成視覚パターンからの知識と単一点スーパービジョンを組み合わせる
- Authors: Yi Yu, Xue Yang, Qingyun Li, Feipeng Da, Jifeng Dai, Yu Qiao, Junchi Yan,
- Abstract要約: 我々は、ポイント教師付きオブジェクト検出のためのエンドツーエンドソリューションであるPoint2RBoxを提案する。
提案手法は軽量なパラダイムを用いているが,点教師付き代替品間での競合性能を実現する。
特に,本手法は軽量なパラダイムを用いるが,点教師付き代替品間での競合性能を実現する。
- 参考スコア(独自算出の注目度): 81.60564776995682
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the rapidly increasing demand for oriented object detection (OOD), recent research involving weakly-supervised detectors for learning rotated box (RBox) from the horizontal box (HBox) has attracted more and more attention. In this paper, we explore a more challenging yet label-efficient setting, namely single point-supervised OOD, and present our approach called Point2RBox. Specifically, we propose to leverage two principles: 1) Synthetic pattern knowledge combination: By sampling around each labeled point on the image, we spread the object feature to synthetic visual patterns with known boxes to provide the knowledge for box regression. 2) Transform self-supervision: With a transformed input image (e.g. scaled/rotated), the output RBoxes are trained to follow the same transformation so that the network can perceive the relative size/rotation between objects. The detector is further enhanced by a few devised techniques to cope with peripheral issues, e.g. the anchor/layer assignment as the size of the object is not available in our point supervision setting. To our best knowledge, Point2RBox is the first end-to-end solution for point-supervised OOD. In particular, our method uses a lightweight paradigm, yet it achieves a competitive performance among point-supervised alternatives, 41.05%/27.62%/80.01% on DOTA/DIOR/HRSC datasets.
- Abstract(参考訳): オブジェクト指向物体検出(OOD)の需要が急速に高まる中、水平箱(HBox)から回転箱(RBox)を学習するための弱い教師付き検出器(RBox)に関する最近の研究が注目されている。
本稿では,より難易度の高いラベル効率設定,すなわち単一点制御OODについて検討し,Point2RBoxというアプローチを提案する。
具体的には,2つの原則を活用することを提案する。
1) 合成パターン知識の組み合わせ: 画像上のラベル付き各点をサンプリングすることにより, 既知ボックスを用いた合成視覚パターンにオブジェクト特徴を拡大し, ボックス回帰の知識を提供する。
2) 変換自己スーパービジョン: 変換された入力画像(例えば、スケール/ローテーション)を用いて、出力RBoxは、オブジェクト間の相対的なサイズ/ローテーションを知覚できるように、同じ変換に従うように訓練される。
この検出器は、周辺問題に対処するいくつかの工夫された技術によってさらに強化されている。
私たちの知る限りでは、Point2RBoxはポイント管理OODの最初のエンドツーエンドソリューションです。
特に,本手法は軽量なパラダイムを用いているが,DOTA/DIOR/HRSCデータセットの41.05%/27.62%/80.01%の点教師付き代替品間での競合性能を実現している。
関連論文リスト
- PointCG: Self-supervised Point Cloud Learning via Joint Completion and Generation [32.04698431036215]
本稿では,マスク付きポイントモデリング(MPM)と3D-to-2D生成という2つの一般的な手法を,事前学習フレームワーク内にプリテキストタスクとして統合する。
我々はこれらの2つの手法によって提供される空間的認識と精密な監督を活用して、それぞれの限界に対処する。
論文 参考訳(メタデータ) (2024-11-09T02:38:29Z) - PointOBB: Learning Oriented Object Detection via Single Point
Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。
PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。
DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2023-11-23T15:51:50Z) - P2RBox: Point Prompt Oriented Object Detection with SAM [28.96914721062631]
我々はP2RBoxを紹介した。これはオブジェクト指向オブジェクト検出のための回転ボックス(RBox)アノテーションを生成するためにポイントプロンプトを利用する。
P2RBoxには、境界感性マスクガイダンスと、空間情報を利用して粒度のあいまいさを低減する中心性ガイダンスという、2つの先進的なガイダンスが組み込まれている。
最先端のポイントアノテート生成手法であるPointOBBと比較すると、P2RBoxはDOTA-v1.0データセット上で約29%のmAPで性能が向上する。
論文 参考訳(メタデータ) (2023-11-22T03:33:00Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - H2RBox-v2: Incorporating Symmetry for Boosting Horizontal Box Supervised
Oriented Object Detection [55.3948651109885]
本稿では,H2RBox-v2を提案する。
我々の知る限り、H2RBox-v2は指向オブジェクト検出のための最初の対称性を意識した自己監督パラダイムである。
論文 参考訳(メタデータ) (2023-04-10T06:11:40Z) - Anchor Free remote sensing detector based on solving discrete polar
coordinate equation [4.708085033897991]
回転・多スケール物体を検出するためのAnchor Free Aviatic Remote Sensor Object Detector (BWP-Det) を提案する。
具体的には、インタラクティブなダブルブランチ(IDB)アップサンプリングネットワークを設計し、ヒートマップの予測に1つのブランチを徐々にアップサンプリングする。
我々は、前景と背景の違いを強調するために、重み付きマルチスケール畳み込み(WmConv)を改善した。
論文 参考訳(メタデータ) (2023-03-21T09:28:47Z) - H2RBox: Horizonal Box Annotation is All You Need for Oriented Object
Detection [63.66553556240689]
オブジェクト指向物体検出は、空中画像から自律運転に至るまで、多くの用途に現れる。
多くの既存の検出ベンチマークには水平バウンディングボックスがアノテートされているが、これはきめ細かな回転ボックスよりもコストが低い。
本稿では,H2RBoxと呼ばれる単純なオブジェクト指向検出手法を提案する。
論文 参考訳(メタデータ) (2022-10-13T05:12:45Z) - Point-to-Box Network for Accurate Object Detection via Single Point
Supervision [51.95993495703855]
オフ・ザ・シェルフ提案法(OTSP)の軽量な代替手法を提案する。
P2BNetは、アンカーのような方法で提案を生成することで、オブジェクト間のバランスの取れた提案バッグを構築することができる。
コードはCOCO.com/ucas-vg/P2BNetでリリースされる。
論文 参考訳(メタデータ) (2022-07-14T11:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。