論文の概要: Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection
- arxiv url: http://arxiv.org/abs/2407.05909v1
- Date: Mon, 8 Jul 2024 13:14:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 15:40:39.097292
- Title: Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection
- Title(参考訳): 半教師付き検出における汎用物体と指向物体のギャップをブリッジするマルチキュー一貫性学習
- Authors: Chenxu Wang, Chunyan Xu, Ziqi Gu, Zhen Cui,
- Abstract要約: 半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
本稿では,これらのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
提案したMCLは,半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を実現することができる。
- 参考スコア(独自算出の注目度): 26.486535389258965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While existing semi-supervised object detection (SSOD) methods perform well in general scenes, they encounter challenges in handling oriented objects in aerial images. We experimentally find three gaps between general and oriented object detection in semi-supervised learning: 1) Sampling inconsistency: the common center sampling is not suitable for oriented objects with larger aspect ratios when selecting positive labels from labeled data. 2) Assignment inconsistency: balancing the precision and localization quality of oriented pseudo-boxes poses greater challenges which introduces more noise when selecting positive labels from unlabeled data. 3) Confidence inconsistency: there exists more mismatch between the predicted classification and localization qualities when considering oriented objects, affecting the selection of pseudo-labels. Therefore, we propose a Multi-clue Consistency Learning (MCL) framework to bridge gaps between general and oriented objects in semi-supervised detection. Specifically, considering various shapes of rotated objects, the Gaussian Center Assignment is specially designed to select the pixel-level positive labels from labeled data. We then introduce the Scale-aware Label Assignment to select pixel-level pseudo-labels instead of unreliable pseudo-boxes, which is a divide-and-rule strategy suited for objects with various scales. The Consistent Confidence Soft Label is adopted to further boost the detector by maintaining the alignment of the predicted results. Comprehensive experiments on DOTA-v1.5 and DOTA-v1.0 benchmarks demonstrate that our proposed MCL can achieve state-of-the-art performance in the semi-supervised oriented object detection task.
- Abstract(参考訳): 既存の半教師付き物体検出(SSOD)法は、一般的な場面でよく機能するが、それらは空中画像におけるオブジェクト指向物体の扱いにおいて困難に直面している。
半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
1) 共通中心サンプリングは, ラベル付きデータから正のラベルを選択する際に, アスペクト比が大きいオブジェクト指向対象には適さない。
2) アサインメントの不整合性: 方向付き擬似箱の精度と位置決め品質のバランスをとると, ラベルなしデータから正のラベルを選択する際に, より多くのノイズが発生するという大きな課題が生じる。
3) 信頼の不整合性: 対象物を考慮した場合, 予測された分類と局所化品質との間には, 擬似ラベルの選択に影響を及ぼすミスマッチが存在する。
そこで本研究では,半教師付き検出における汎用オブジェクトと指向オブジェクトのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
具体的には、回転物体の様々な形状を考慮すると、ガウス中心割り当てはラベル付きデータから画素レベルの正のラベルを選択するように設計されている。
次に、信頼できない擬似箱の代わりに画素レベルの擬似ラベルを選択するために、スケール対応ラベルアサインメントを導入する。
一致信頼ソフトラベルは、予測結果のアライメントを維持することにより、検出器をさらに強化するために採用される。
DOTA-v1.5 および DOTA-v1.0 ベンチマークの総合的な実験により,提案した MCL が半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を達成できることが実証された。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Dynamic Anchor Learning for Arbitrary-Oriented Object Detection [4.247967690041766]
任意指向オブジェクトは、自然のシーン、空中写真、リモートセンシング画像などに広く現れる。
現在の回転検出器は、異なる向きのアンカーをたくさん使用して、地上の真実ボックスとの空間アライメントを実現します。
新たに定義されたマッチング度を利用した動的アンカー学習(DAL)法を提案する。
論文 参考訳(メタデータ) (2020-12-08T01:30:06Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z) - AutoAssign: Differentiable Label Assignment for Dense Object Detection [94.24431503373884]
Auto COCOは、物体検出のためのアンカーフリー検出器である。
外観認識は、完全に微分可能な重み付け機構によって実現される。
我々の最良のモデルでは52.1%のAPが達成され、既存の1段検出器よりも優れている。
論文 参考訳(メタデータ) (2020-07-07T14:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。