論文の概要: SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2407.01016v2
- Date: Thu, 25 Sep 2025 14:03:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.425431
- Title: SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection
- Title(参考訳): SOOD++: 未ラベルデータの活用によるオブジェクト指向オブジェクト検出の強化
- Authors: Dingkang Liang, Wei Hua, Chunsheng Shi, Zhikang Zou, Xiaoqing Ye, Xiang Bai,
- Abstract要約: 本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、密度分布を持つ。
各種ラベル付き環境下での多目的対象物に対する大規模な実験により,本手法の有効性が示された。
- 参考スコア(独自算出の注目度): 68.18620488664187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised object detection (SSOD), leveraging unlabeled data to boost object detectors, has become a hot topic recently. However, existing SSOD approaches mainly focus on horizontal objects, leaving oriented objects common in aerial images unexplored. At the same time, the annotation cost of oriented objects is significantly higher than that of their horizontal counterparts. Therefore, in this paper, we propose a simple yet effective Semi-supervised Oriented Object Detection method termed SOOD++. Specifically, we observe that objects from aerial images usually have arbitrary orientations, small scales, and dense distribution, which inspires the following core designs: a Simple Instance-aware Dense Sampling (SIDS) strategy is used to generate comprehensive dense pseudo-labels; the Geometry-aware Adaptive Weighting (GAW) loss dynamically modulates the importance of each pair between pseudo-label and corresponding prediction by leveraging the intricate geometric information of aerial objects; we treat aerial images as global layouts and explicitly build the many-to-many relationship between the sets of pseudo-labels and predictions via the proposed Noise-driven Global Consistency (NGC). Extensive experiments conducted on various oriented object datasets under various labeled settings demonstrate the effectiveness of our method. For example, on the DOTA-V2.0/DOTA-V1.5 benchmark, the proposed method outperforms previous state-of-the-art (SOTA) by a large margin (+2.90/2.14, +2.16/2.18, and +2.66/2.32) mAP under 10%, 20%, and 30% labeled data settings, respectively, with single-scale training and testing. More importantly, it still improves upon a strong supervised baseline with 70.66 mAP, trained using the full DOTA-V1.5 train-val set, by +1.82 mAP, resulting in a 72.48 mAP, pushing the new state-of-the-art. The project page is at https://dk-liang.github.io/SOODv2/
- Abstract(参考訳): 半教師付き物体検出(SSOD)は、未ラベルデータを利用して物体検出を促進しているが、近年ホットな話題となっている。
しかし、既存のSSODアプローチは、主に水平物体に焦点を合わせ、空中画像に共通する指向物体を残している。
同時に、オブジェクト指向オブジェクトのアノテーションコストは、水平オブジェクトのアノテーションコストよりも大幅に高い。
そこで本研究では,SOOD++と呼ばれる,シンプルで効果的な半教師付きオブジェクト指向物体検出手法を提案する。
具体的には, 空中画像からのオブジェクトは, 任意の向き, 規模, 密度分布を持ち, 複雑な擬似ラベルを生成するためのSIDS (Simple Instance-aware Dense Sampling) 戦略, ジオメトリー・アウェア適応重み付け (Geometry-aware Adaptive Weighting, GAW) 損失は, 空中オブジェクトの複雑な幾何学的情報を活用することによって, 擬似ラベルと対応する予測のペアの重要性を動的に変調し, 空中画像をグローバルレイアウトとして扱い, 提案したノイズ駆動グローバル一貫性 (NGC) を通じて擬似ラベルの集合と予測との多面的関係を明示的に構築する。
様々なラベル付き環境下でのオブジェクト指向オブジェクトデータセットの大規模実験により,本手法の有効性を実証した。
例えば、DOTA-V2.0/DOTA-V1.5ベンチマークでは、提案手法は従来の最先端(SOTA)よりも大きなマージン(+2.90/2.14、+2.16/2.18、+2.66/2.32)のmAPを10%、20%、ラベル付きデータ設定で、シングルスケールのトレーニングとテストでそれぞれ上回っている。
さらに重要な点として、70.66 mAPの強い監督されたベースラインを改良し、DOTA-V1.5のフルモデルを使用して+1.82 mAPで訓練し、72.48 mAPで新しい最先端の車種を推し進めた。
プロジェクトページはhttps://dk-liang.github.io/SOODv2/にある。
関連論文リスト
- Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection [26.486535389258965]
半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
本稿では,これらのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
提案したMCLは,半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2024-07-08T13:14:25Z) - Category-Aware Dynamic Label Assignment with High-Quality Oriented Proposal [17.674175038655058]
本稿では,オブジェクト指向検出フレームワークにおいて,複素平面に基づく OBB 表現を導入する。
コンバータRPNヘッドは、角度情報を予測するために構成される。
提案した損失関数とコンバータRPNヘッドは,高品質な指向性の提案を共同で生成する。
論文 参考訳(メタデータ) (2024-07-03T15:36:47Z) - USD: Unknown Sensitive Detector Empowered by Decoupled Objectness and
Segment Anything Model [14.080744645704751]
Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
本稿では,この2つの境界の学習をデコーダ層に分割する,シンプルで効果的な学習戦略であるDecoupled Objectness Learning(DOL)を提案する。
また、擬似ラベルとソフトウェイト戦略を用いてノイズの負の影響を緩和する補助的スーパービジョンフレームワーク(ASF)も導入する。
論文 参考訳(メタデータ) (2023-06-04T06:42:09Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - AutoAssign: Differentiable Label Assignment for Dense Object Detection [94.24431503373884]
Auto COCOは、物体検出のためのアンカーフリー検出器である。
外観認識は、完全に微分可能な重み付け機構によって実現される。
我々の最良のモデルでは52.1%のAPが達成され、既存の1段検出器よりも優れている。
論文 参考訳(メタデータ) (2020-07-07T14:32:21Z) - Dynamic Refinement Network for Oriented and Densely Packed Object
Detection [75.29088991850958]
本稿では,機能選択モジュール (FSM) と動的改善ヘッド (DRH) の2つの新しいコンポーネントからなる動的精細化ネットワークを提案する。
我々のFSMは、ニューロンがターゲットオブジェクトの形状や向きに応じて受容野を調整できるのに対して、DRHはオブジェクト認識の方法で動的に予測を洗練させる。
我々は、DOTA、HRSC2016、SKU110K、および我々のSKU110K-Rデータセットを含むいくつかの公開ベンチマークで定量的評価を行う。
論文 参考訳(メタデータ) (2020-05-20T11:35:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。