論文の概要: Plug and Play Active Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2211.11612v1
- Date: Mon, 21 Nov 2022 16:13:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 18:55:57.037961
- Title: Plug and Play Active Learning for Object Detection
- Title(参考訳): 物体検出のためのプラグ・アンド・プレイ能動学習
- Authors: Chenhongyi Yang, Lichao Huang, Elliot J. Crowley
- Abstract要約: アクティブな学習アルゴリズムは、典型的には不確実性に基づくか多様性に基づく。
どちらも画像分類に成功しているが、物体検出に関しては不十分である。
本稿では,これらの課題を克服する2段階能動学習アルゴリズムPlug and Play Active Learning (PPAL)を提案する。
- 参考スコア(独自算出の注目度): 13.772109618082382
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Annotating data for supervised learning is expensive and tedious, and we want
to do as little of it as possible. To make the most of a given "annotation
budget" we can turn to active learning (AL) which aims to identify the most
informative samples in a dataset for annotation. Active learning algorithms are
typically uncertainty-based or diversity-based. Both have seen success in image
classification, but fall short when it comes to object detection. We
hypothesise that this is because: (1) it is difficult to quantify uncertainty
for object detection as it consists of both localisation and classification,
where some classes are harder to localise, and others are harder to classify;
(2) it is difficult to measure similarities for diversity-based AL when images
contain different numbers of objects. We propose a two-stage active learning
algorithm Plug and Play Active Learning (PPAL) that overcomes these
difficulties. It consists of (1) Difficulty Calibrated Uncertainty Sampling, in
which we used a category-wise difficulty coefficient that takes both
classification and localisation into account to re-weight object uncertainties
for uncertainty-based sampling; (2) Category Conditioned Matching Similarity to
compute the similarities of multi-instance images as ensembles of their
instance similarities. PPAL is highly generalisable because it makes no change
to model architectures or detector training pipelines. We benchmark PPAL on the
MS-COCO and Pascal VOC datasets using different detector architectures and show
that our method outperforms the prior state-of-the-art. Code is available at
https://github.com/ChenhongyiYang/PPAL
- Abstract(参考訳): 教師付き学習のためのデータアノテーションは高価で退屈です。
与えられた“注釈予算”を最大限に活用するために、アノテーション用のデータセットでもっとも有用なサンプルを特定することを目的とした、アクティブラーニング(al)に目を向けることができます。
アクティブな学習アルゴリズムは通常不確実性に基づくか多様性に基づく。
どちらも画像分類に成功しているが、物体検出に関しては不十分である。
これは,(1)局所化と分類の両方からなる物体検出の不確かさの定量化が困難であり,あるクラスは局所化が困難であり,他のクラスは分類が困難である;(2)画像が異なる対象数を含む場合,多様性に基づくALの類似度を測定することは困難である。
本稿では,これらの課題を克服する2段階能動学習アルゴリズムPlug and Play Active Learning (PPAL)を提案する。
本手法は,(1)不確実性サンプリングのための再重み付きオブジェクトの不確実性を考慮した分類と局所化の両方を考慮したカテゴリー的難易度係数を用いた,(2)複数インスタンス画像の類似性を計算するためのカテゴリー的条件付きマッチング類似性からなる。
PPALは、モデルアーキテクチャや検出器トレーニングパイプラインの変更をしないため、非常に一般的なものである。
我々は,MS-COCOおよびPascal VOCデータセットのPPALを異なる検出器アーキテクチャを用いてベンチマークし,提案手法が先行技術よりも優れていることを示す。
コードはhttps://github.com/chenhongyiyang/ppalで入手できる。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Combining X-Vectors and Bayesian Batch Active Learning: Two-Stage Active Learning Pipeline for Speech Recognition [0.0]
本稿では,音声認識のための新しい2段階アクティブ・ラーニング・パイプラインを提案する。
第1段階では、ラベルなし音声データから多様なサンプル選択を行うために、xベクトルクラスタリングを用いて教師なしALを利用する。
第2段階には、ASR用に特別に開発されたバッチALメソッドを備えた、教師付きAL戦略が組み込まれている。
論文 参考訳(メタデータ) (2024-05-03T19:24:41Z) - Mean-AP Guided Reinforced Active Learning for Object Detection [31.304039641225504]
本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - Dense Learning based Semi-Supervised Object Detection [46.885301243656045]
半教師付きオブジェクト検出(SSOD)は、大量のラベルのないデータの助けを借りて、オブジェクト検出器の訓練と展開を容易にすることを目的としている。
本稿では,DenSe Learningに基づくアンカーフリーSSODアルゴリズムを提案する。
実験はMS-COCOとPASCAL-VOCで行われ,提案手法は新たな最先端SSOD性能を記録する。
論文 参考訳(メタデータ) (2022-04-15T02:31:02Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Beyond Simple Meta-Learning: Multi-Purpose Models for Multi-Domain,
Active and Continual Few-Shot Learning [41.07029317930986]
低ラベル方式で動作するモデルの分散感応クラスを提案する。
最初の手法であるSimple CNAPSは階層的に正規化されたマハラノビス距離に基づく分類器を用いる。
我々はさらに、このアプローチをトランスダクティブ学習環境に拡張し、トランスダクティブCNAPSを提案する。
論文 参考訳(メタデータ) (2022-01-13T18:59:02Z) - Plug-and-Play Few-shot Object Detection with Meta Strategy and Explicit
Localization Inference [78.41932738265345]
本稿では, 微調整を行なわずに新しいカテゴリーの物体を正確に検出できるプラグ検出器を提案する。
局所化プロセスに2つの明示的な推論を導入し、アノテーション付きデータへの依存を減らす。
これは、様々な評価プロトコルの下で、効率、精度、リコールの両方において大きなリードを示している。
論文 参考訳(メタデータ) (2021-10-26T03:09:57Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。