論文の概要: Point2RBox-v2: Rethinking Point-supervised Oriented Object Detection with Spatial Layout Among Instances
- arxiv url: http://arxiv.org/abs/2502.04268v2
- Date: Fri, 07 Feb 2025 02:23:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 11:34:38.158485
- Title: Point2RBox-v2: Rethinking Point-supervised Oriented Object Detection with Spatial Layout Among Instances
- Title(参考訳): Point2RBox-v2: インスタンス間の空間レイアウトによる点教師付きオブジェクト指向オブジェクト検出の再考
- Authors: Yi Yu, Botao Ren, Peiyuan Zhang, Mingxin Liu, Junwei Luo, Shaofeng Zhang, Feipeng Da, Junchi Yan, Xue Yang,
- Abstract要約: ここでは,P2RBox-v2という,点教師付きOOD学習インスタンス間の空間的レイアウトを探索する手法を提案する。
私たちのソリューションはエレガントで軽量ですが、特に密集したシーンでは、競争力のあるパフォーマンスが期待できます。
- 参考スコア(独自算出の注目度): 50.80161958767447
- License:
- Abstract: With the rapidly increasing demand for oriented object detection (OOD), recent research involving weakly-supervised detectors for learning OOD from point annotations has gained great attention. In this paper, we rethink this challenging task setting with the layout among instances and present Point2RBox-v2. At the core are three principles: 1) Gaussian overlap loss. It learns an upper bound for each instance by treating objects as 2D Gaussian distributions and minimizing their overlap. 2) Voronoi watershed loss. It learns a lower bound for each instance through watershed on Voronoi tessellation. 3) Consistency loss. It learns the size/rotation variation between two output sets with respect to an input image and its augmented view. Supplemented by a few devised techniques, e.g. edge loss and copy-paste, the detector is further enhanced. To our best knowledge, Point2RBox-v2 is the first approach to explore the spatial layout among instances for learning point-supervised OOD. Our solution is elegant and lightweight, yet it is expected to give a competitive performance especially in densely packed scenes: 62.61%/86.15%/34.71% on DOTA/HRSC/FAIR1M. Code is available at https://github.com/VisionXLab/point2rbox-v2.
- Abstract(参考訳): オブジェクト指向物体検出(OOD)の需要が急速に高まる中、ポイントアノテーションからOODを学習するための弱い教師付き検出器に関する最近の研究が注目されている。
本稿では、インスタンス間のレイアウトとPoint2RBox-v2を併用して、この困難なタスク設定を再考する。
中心となる原則は3つある。
1)ガウス重なり損失。
オブジェクトを2次元ガウス分布として扱い、オーバーラップを最小限にすることで、各インスタンスの上限を学習する。
2)ヴォロノイ水害。
ボロノイテッセルレーションの流域を通して各インスタンスの低い境界を学習する。
3)一貫性の喪失。
入力画像とその拡張ビューに関して、2つの出力セット間のサイズ/回転変動を学習する。
エッジの喪失やコピーペーストなど、いくつかの工夫された技術によって補われ、検出器はさらに強化されている。
我々の知る限り、Point2RBox-v2は、ポイント管理OODを学習するためのインスタンス間の空間的レイアウトを探索する最初のアプローチである。
我々のソリューションはエレガントで軽量だが、特に62.61%/86.15%/34.71%という密集したシーンでは、DOTA/HRSC/FAIR1M上での競争性能が期待できる。
コードはhttps://github.com/VisionXLab/point2rbox-v2.comで入手できる。
関連論文リスト
- Wholly-WOOD: Wholly Leveraging Diversified-quality Labels for Weakly-supervised Oriented Object Detection [57.26265276035267]
Wholly-WOODは、様々なラベリング形式を完全に活用できる弱い管理のOODフレームワークである。
トレーニングにHBoxのみを使用することで、RBoxでトレーニングされたリモートセンシングと非常に近いパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2025-02-13T16:34:59Z) - FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection [10.655167287088368]
最小点距離に基づく任意の形状比較のための新しい計量法を提案する。
FPDIoU$損失は、最先端の回転オブジェクト検出に適用される。
論文 参考訳(メタデータ) (2024-05-16T09:44:00Z) - NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-end Oriented Object Detection with Single Point Supervision [81.60564776995682]
我々は、ポイント教師付きオブジェクト検出のためのエンドツーエンドソリューションであるPoint2RBoxを提案する。
提案手法は軽量なパラダイムを用いているが,点教師付き代替品間での競合性能を実現する。
特に,本手法は軽量なパラダイムを用いるが,点教師付き代替品間での競合性能を実現する。
論文 参考訳(メタデータ) (2023-11-23T15:57:41Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - H2RBox: Horizonal Box Annotation is All You Need for Oriented Object
Detection [63.66553556240689]
オブジェクト指向物体検出は、空中画像から自律運転に至るまで、多くの用途に現れる。
多くの既存の検出ベンチマークには水平バウンディングボックスがアノテートされているが、これはきめ細かな回転ボックスよりもコストが低い。
本稿では,H2RBoxと呼ばれる単純なオブジェクト指向検出手法を提案する。
論文 参考訳(メタデータ) (2022-10-13T05:12:45Z) - Depth Is All You Need for Monocular 3D Detection [29.403235118234747]
教師なしの方法で対象領域に深度表現を合わせることを提案する。
本手法では, トレーニング時間中に利用可能なLiDARやRGBビデオを利用して深度表現を微調整し, 改良された3D検出器を実現する。
論文 参考訳(メタデータ) (2022-10-05T18:12:30Z) - Graph R-CNN: Towards Accurate 3D Object Detection with
Semantic-Decorated Local Graph [26.226885108862735]
2段検出器は3次元物体検出で大いに人気を博している。
ほとんどの2段式3D検出器は、2段目のRoI特徴抽出にグリッドポイント、ボクセルグリッド、またはサンプルキーポイントを利用する。
本稿ではこの問題を3つの側面で解決する。
論文 参考訳(メタデータ) (2022-08-07T02:56:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。