論文の概要: Large-Scale Object Detection in the Wild from Imbalanced Multi-Labels
- arxiv url: http://arxiv.org/abs/2005.08455v1
- Date: Mon, 18 May 2020 04:36:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 23:49:07.885275
- Title: Large-Scale Object Detection in the Wild from Imbalanced Multi-Labels
- Title(参考訳): 不平衡マルチラベルから野生の大規模物体検出
- Authors: Junran Peng, Xingyuan Bu, Ming Sun, Zhaoxiang Zhang, Tieniu Tan,
Junjie Yan
- Abstract要約: 本研究では,対象物が明示的にあるいは暗黙的に複数のラベルを持つ可能性のあるラベル問題を定量的に解析する。
ラベルの不均衡に対処するために,ハイブリッドトレーニングスケジューラを用いたソフトサンプリング手法を提案する。
提案手法は3.34点の劇的な改善を実現し,オープンイメージの公開オブジェクト検出テストセット上で60.90mAPの最高の単一モデルを実現する。
- 参考スコア(独自算出の注目度): 128.77822070156057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training with more data has always been the most stable and effective way of
improving performance in deep learning era. As the largest object detection
dataset so far, Open Images brings great opportunities and challenges for
object detection in general and sophisticated scenarios. However, owing to its
semi-automatic collecting and labeling pipeline to deal with the huge data
scale, Open Images dataset suffers from label-related problems that objects may
explicitly or implicitly have multiple labels and the label distribution is
extremely imbalanced. In this work, we quantitatively analyze these label
problems and provide a simple but effective solution. We design a concurrent
softmax to handle the multi-label problems in object detection and propose a
soft-sampling methods with hybrid training scheduler to deal with the label
imbalance. Overall, our method yields a dramatic improvement of 3.34 points,
leading to the best single model with 60.90 mAP on the public object detection
test set of Open Images. And our ensembling result achieves 67.17 mAP, which is
4.29 points higher than the best result of Open Images public test 2018.
- Abstract(参考訳): より多くのデータによるトレーニングは、ディープラーニング時代のパフォーマンスを改善する最も安定的で効果的な方法です。
これまでのところ最大のオブジェクト検出データセットであるオープンイメージは、汎用的で洗練されたシナリオにおいて、オブジェクト検出に大きな機会と課題をもたらします。
しかし、巨大なデータスケールを扱うための半自動的な収集とラベリングパイプラインのため、open imagesデータセットは、オブジェクトが明示的または暗黙的に複数のラベルを持ち、ラベル分布が非常に不均衡なラベル関連の問題に苦しむ。
本研究では,これらのラベル問題を定量的に解析し,単純かつ効果的な解法を提供する。
オブジェクト検出におけるマルチラベル問題を扱うために,並列ソフトマックスを設計し,ラベルの不均衡に対処するハイブリッドトレーニングスケジューラを用いたソフトサンプリング手法を提案する。
全体として,提案手法は3.34点の劇的な改善を実現し,オープンイメージの公開オブジェクト検出テストセット上で60.90mAPの最高の単一モデルとなった。
私たちのアンサンブルの結果は67.17 mAPに達し、これはOpen Imagesのパブリックテスト 2018の最高の結果よりも4.29ポイント高い。
関連論文リスト
- Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection [26.486535389258965]
半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
本稿では,これらのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
提案したMCLは,半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2024-07-08T13:14:25Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Weakly Semi-supervised Tool Detection in Minimally Invasive Surgery
Videos [11.61305113932032]
外科的ツール検出は、最小侵襲の手術ビデオの分析と評価に不可欠である。
インスタンスレベルのラベルを持つ大規模なイメージデータセットは、アノテーションの負担のために制限されることが多い。
本研究では,非常にコストのかかるアノテーションの重み付けと検出性能のバランスをとることを提案する。
論文 参考訳(メタデータ) (2024-01-05T13:05:02Z) - ALWOD: Active Learning for Weakly-Supervised Object Detection [14.063031246614488]
我々は、弱い、半教師付きオブジェクト検出パラダイムでアクティブな学習を融合させる新しいフレームワークALWODを提案する。
ALWODは、一部のラベル付きだが戦略的に選択された画像インスタンスで訓練されたODと、完全にラベル付けされたデータに依存するODとのギャップを著しく狭めることを示した。
論文 参考訳(メタデータ) (2023-09-14T17:59:05Z) - The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation
via Point-Guided Mask Representation [61.027468209465354]
本稿では,ポイントラベル付き弱半教師付きインスタンスセグメンテーション(WSSIS)という新しい学習手法を提案する。
本稿では、予算に優しいポイントラベルを強力な弱監督源として効果的に活用できるWSSISの手法を提案する。
我々はCOCOとBDD100Kデータセットの広範な実験を行い、提案手法は完全な教師付きモデルのデータセットに匹敵する有望な結果を得る。
論文 参考訳(メタデータ) (2023-03-27T10:11:22Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Large-Scale Unsupervised Person Re-Identification with Contrastive
Learning [17.04597303816259]
ほとんどの既存の非監視およびドメイン適応ReIDメソッドは、実験で公開データセットのみを使用します。
コントラスト学習による大規模自己監視画像分類の最近の進歩に触発され, 大規模非ラベル監視映像だけでReID表現を学習することを提案する。
論文 参考訳(メタデータ) (2021-05-17T14:55:08Z) - Towards Good Practices for Efficiently Annotating Large-Scale Image
Classification Datasets [90.61266099147053]
多数の画像の分類ラベルを収集するための効率的なアノテーション戦略を検討する。
人間のラベリング作業を最小化するための修正とベストプラクティスを提案します。
ImageNet100の125kイメージサブセットのシミュレーション実験では、平均で0.35のアノテーションで80%のトップ-1の精度でアノテートできることが示されている。
論文 参考訳(メタデータ) (2021-04-26T16:29:32Z) - Data-Uncertainty Guided Multi-Phase Learning for Semi-Supervised Object
Detection [66.10057490293981]
半監視対象検出のためのデータ不確実性誘導多相学習法を提案する。
本手法は,ベースライン手法と比較して異常に動作し,大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-03-29T09:27:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。