論文の概要: Towards A Category-extended Object Detector without Relabeling or
Conflicts
- arxiv url: http://arxiv.org/abs/2012.14115v1
- Date: Mon, 28 Dec 2020 06:44:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 11:04:17.621443
- Title: Towards A Category-extended Object Detector without Relabeling or
Conflicts
- Title(参考訳): ラベルや衝突のないカテゴリー拡張オブジェクト検出器を目指して
- Authors: Bowen Zhao, Chen Chen, Wanpeng Xiao, Xi Xiao, Qi Ju, Shutao Xia
- Abstract要約: 本稿では,手作業を必要とせずに,限られたデータセットに基づいてすべてのカテゴリを処理可能な,強力な統一型検出器の傾きを目標とする。
提案手法は, 基礎モデルの改善, 未ラベルの地中埋立処分戦略の改善, 疑似アノテーションによる再訓練手法の3つの側面に着目した実践的枠組みを提案する。
- 参考スコア(独自算出の注目度): 40.714221493482974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detectors are typically learned based on fully-annotated training data
with fixed pre-defined categories. However, not all possible categories of
interest can be known beforehand, as classes are often required to be increased
progressively in many realistic applications. In such scenario, only the
original training set annotated with the old classes and some new training data
labeled with the new classes are available. In this paper, we aim at leaning a
strong unified detector that can handle all categories based on the limited
datasets without extra manual labor. Vanilla joint training without considering
label ambiguity leads to heavy biases and poor performance due to the
incomplete annotations. To avoid such situation, we propose a practical
framework which focuses on three aspects: better base model, better unlabeled
ground-truth mining strategy and better retraining method with pseudo
annotations. First, a conflict-free loss is proposed to obtain a usable base
detector. Second, we employ Monte Carlo Dropout to calculate the localization
confidence, combined with the classification confidence, to mine more accurate
bounding boxes. Third, we explore several strategies for making better use of
pseudo annotations during retraining to achieve more powerful detectors.
Extensive experiments conducted on multiple datasets demonstrate the
effectiveness of our framework for category-extended object detectors.
- Abstract(参考訳): オブジェクト検出器は通常、あらかじめ定義されたカテゴリを固定した完全なアノテーション付きトレーニングデータに基づいて学習される。
しかし、多くの現実的なアプリケーションでクラスを段階的に増やすことがしばしば要求されるため、興味のあるすべてのカテゴリを事前に知ることはできない。
このようなシナリオでは、古いクラスに注釈付けされた元のトレーニングセットと、新しいクラスにラベル付けされた新しいトレーニングデータのみが利用可能です。
本稿では,手作業を必要とせずに,限られたデータセットに基づいてすべてのカテゴリを処理可能な,強力な統一型検出器の傾きを目標とする。
ラベルの曖昧さを考慮しないバニラ合同トレーニングは、不完全なアノテーションのため、大きなバイアスとパフォーマンスの低下につながる。
このような状況を避けるために,我々は,ベースモデルの改善,ラベルなし地中マイニング戦略の改善,擬似アノテーションによる再トレーニング方法の改善という3つの側面に注目した実践的枠組みを提案する。
まず、使用可能なベース検出器を得るために、競合のない損失を提案する。
次に,モンテカルロ・ドロップアウトを用いて局所化信頼度と分類信頼度を組み合わせ,より正確な境界ボックスをマイニングする。
第3に,再トレーニング中に擬似アノテーションをより有効に活用して,より強力な検出を実現するためのいくつかの戦略を検討する。
複数のデータセット上で行った広範囲な実験は、カテゴリ拡張オブジェクト検出器に対するフレームワークの有効性を実証している。
関連論文リスト
- Liberating Seen Classes: Boosting Few-Shot and Zero-Shot Text Classification via Anchor Generation and Classification Reframing [38.84431954053434]
短いショットとゼロショットのテキスト分類は、ラベル付きサンプルやラベル付きサンプルが全くない新しいクラスからのサンプルを認識することを目的としている。
少数ショットとゼロショットのテキスト分類のためのシンプルで効果的な戦略を提案する。
論文 参考訳(メタデータ) (2024-05-06T15:38:32Z) - Task-Specific Embeddings for Ante-Hoc Explainable Text Classification [6.671252951387647]
テキストのタスク固有の埋め込みを学習する学習目標を提案する。
提案する目的は,同一のクラスラベルを共有するすべてのテキストが近接しているように埋め込みを学習することである。
本研究は, 総合的な分類精度において, アンテホックな説明可能性と漸進的な学習の利点が無コストで得られることを示す広範囲な実験である。
論文 参考訳(メタデータ) (2022-11-30T19:56:25Z) - Bridging Non Co-occurrence with Unlabeled In-the-wild Data for
Incremental Object Detection [56.22467011292147]
物体検出における破滅的忘れを緩和するために,いくつかの漸進的学習法が提案されている。
有効性にもかかわらず、これらの手法は新規クラスのトレーニングデータにラベルのないベースクラスの共起を必要とする。
そこで本研究では,新たな授業の訓練において,欠落した基本クラスが原因で生じる非発生を補うために,未ラベルのインザ・ザ・ワイルドデータを使用することを提案する。
論文 参考訳(メタデータ) (2021-10-28T10:57:25Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Towards Cross-Granularity Few-Shot Learning: Coarse-to-Fine
Pseudo-Labeling with Visual-Semantic Meta-Embedding [13.063136901934865]
少ないショットラーニングは、テスト時に少数のサンプルしか持たない、新しいカテゴリに迅速に適応することを目的としている。
本稿では,より困難なシナリオ,すなわちクロスグラニュラリティ・グラニュラリティ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラ
画像埋め込みの類似性に応じて,各粗いクラスを擬似微細クラスにグリーディクラスタリングすることで,詳細なデータ分布を近似する。
論文 参考訳(メタデータ) (2020-07-11T03:44:21Z) - Any-Shot Object Detection [81.88153407655334]
「アニーショット検出」とは、全く見えず、数発のカテゴリが推論中に同時に共起できる場所である。
我々は、ゼロショットと少数ショットの両方のオブジェクトクラスを同時に検出できる、統合された任意のショット検出モデルを提案する。
我々のフレームワークは、ゼロショット検出とFewショット検出タスクにのみ使用できる。
論文 参考訳(メタデータ) (2020-03-16T03:43:15Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。