論文の概要: Plug and Play Active Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2211.11612v2
- Date: Thu, 14 Mar 2024 15:35:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-16 03:23:03.665595
- Title: Plug and Play Active Learning for Object Detection
- Title(参考訳): 物体検出のためのプラグアンドプレイアクティブラーニング
- Authors: Chenhongyi Yang, Lichao Huang, Elliot J. Crowley,
- Abstract要約: オブジェクト検出のためのPlug and Play Active Learning(PPAL)を導入する。
PPALは不確実性と多様性に基づくサンプリングフェーズを含む2段階の手法である。
我々は,MS-COCOおよびPascal VOCデータセット上で,異なる検出器アーキテクチャを用いてPPALをベンチマークした。
- 参考スコア(独自算出の注目度): 12.50247484568549
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Annotating datasets for object detection is an expensive and time-consuming endeavor. To minimize this burden, active learning (AL) techniques are employed to select the most informative samples for annotation within a constrained "annotation budget". Traditional AL strategies typically rely on model uncertainty or sample diversity for query sampling, while more advanced methods have focused on developing AL-specific object detector architectures to enhance performance. However, these specialized approaches are not readily adaptable to different object detectors due to the significant engineering effort required for integration. To overcome this challenge, we introduce Plug and Play Active Learning (PPAL), a simple and effective AL strategy for object detection. PPAL is a two-stage method comprising uncertainty-based and diversity-based sampling phases. In the first stage, our Difficulty Calibrated Uncertainty Sampling leverage a category-wise difficulty coefficient that combines both classification and localisation difficulties to re-weight instance uncertainties, from which we sample a candidate pool for the subsequent diversity-based sampling. In the second stage, we propose Category Conditioned Matching Similarity to better compute the similarities of multi-instance images as ensembles of their instance similarities, which is used by the k-Means++ algorithm to sample the final AL queries. PPAL makes no change to model architectures or detector training pipelines; hence it can be easily generalized to different object detectors. We benchmark PPAL on the MS-COCO and Pascal VOC datasets using different detector architectures and show that our method outperforms prior work by a large margin. Code is available at https://github.com/ChenhongyiYang/PPAL
- Abstract(参考訳): オブジェクト検出のためのデータセットの注釈付けは、高価で時間を要する作業である。
この負担を最小限に抑えるため、アクティブラーニング(AL)技術を用いて、制約付きアノテーション予算の中で最も情報性の高いアノテーションサンプルを選択する。
従来のAL戦略は、通常、クエリサンプリングのためのモデル不確実性やサンプルの多様性に頼っているが、より高度な手法は、AL固有のオブジェクト検出アーキテクチャの開発に重点を置いて、パフォーマンスを向上させる。
しかし、これらの特殊なアプローチは、統合に必要な重要なエンジニアリング努力のために、異なるオブジェクト検出器に容易に適応できない。
この課題を克服するために、オブジェクト検出のためのシンプルで効果的なAL戦略であるPlug and Play Active Learning (PPAL)を導入する。
PPALは不確実性と多様性に基づくサンプリングフェーズを含む2段階の手法である。
第1段階では、分類と局所化の難しさと再重み付きインスタンスの不確実性の両方を組み合わせたカテゴリワイドの難易度係数を利用して、その後の多様性に基づくサンプリングの候補プールをサンプリングする。
第2段階では,k-Means++アルゴリズムを用いて最終的なALクエリをサンプリングし,複数インスタンス画像の類似性をインスタンス類似性のアンサンブルとしてよりよく計算するカテゴリ条件マッチング類似性を提案する。
PPALはモデルアーキテクチャや検出器訓練パイプラインを変更しないため、異なる物体検出器に容易に一般化することができる。
我々は,MS-COCO と Pascal VOC のデータセット上で,異なる検出器アーキテクチャを用いてPPAL をベンチマークし,本手法が先行処理よりも高い性能を示すことを示す。
コードはhttps://github.com/ChenhongyiYang/PPALで公開されている。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition [0.0]
本稿では,音声認識のための新しい2段階アクティブ・ラーニング・パイプラインを提案する。
第1段階では、ラベルなし音声データから多様なサンプル選択を行うために、xベクトルクラスタリングを用いて教師なしALを利用する。
第2段階には、ASR用に特別に開発されたバッチALメソッドを備えた、教師付きAL戦略が組み込まれている。
論文 参考訳(メタデータ) (2024-05-03T19:24:41Z) - Mean-AP Guided Reinforced Active Learning for Object Detection [31.304039641225504]
本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - Dense Learning based Semi-Supervised Object Detection [46.885301243656045]
半教師付きオブジェクト検出(SSOD)は、大量のラベルのないデータの助けを借りて、オブジェクト検出器の訓練と展開を容易にすることを目的としている。
本稿では,DenSe Learningに基づくアンカーフリーSSODアルゴリズムを提案する。
実験はMS-COCOとPASCAL-VOCで行われ,提案手法は新たな最先端SSOD性能を記録する。
論文 参考訳(メタデータ) (2022-04-15T02:31:02Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Beyond Simple Meta-Learning: Multi-Purpose Models for Multi-Domain,
Active and Continual Few-Shot Learning [41.07029317930986]
低ラベル方式で動作するモデルの分散感応クラスを提案する。
最初の手法であるSimple CNAPSは階層的に正規化されたマハラノビス距離に基づく分類器を用いる。
我々はさらに、このアプローチをトランスダクティブ学習環境に拡張し、トランスダクティブCNAPSを提案する。
論文 参考訳(メタデータ) (2022-01-13T18:59:02Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。