論文の概要: Top-Related Meta-Learning Method for Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2007.06837v6
- Date: Tue, 15 Jun 2021 08:29:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 14:08:32.840298
- Title: Top-Related Meta-Learning Method for Few-Shot Object Detection
- Title(参考訳): Few-Shotオブジェクト検出のためのTop-Related Meta-Learning法
- Authors: Qian Li, Nan Guo, Xiaochun Ye, Duo Wang, Dongrui Fan and Zhimin Tang
- Abstract要約: 分類タスクのためのTop-C分類損失(TL-C)とメタモデルにより得られたカテゴリベースメタ機能のためのカテゴリベースグループ化機構を提案する。
我々の技術は、数発の撮影で過去の最先端の手法よりも大幅に優れています。
- 参考スコア(独自算出の注目度): 8.144721518458844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many meta-learning methods are proposed for few-shot detection. However,
previous most methods have two main problems, poor detection APs, and strong
bias because of imbalance and insufficient datasets. Previous works mainly
alleviate these issues by additional datasets, multi-relation attention
mechanisms and sub-modules. However, they require more cost. In this work, for
meta-learning, we find that the main challenges focus on related or irrelevant
semantic features between categories. Therefore, based on semantic features, we
propose a Top-C classification loss (i.e., TCL-C) for classification task and a
category-based grouping mechanism for category-based meta-features obtained by
the meta-model. The TCL-C exploits the true-label prediction and the most
likely C-1 false classification predictions to improve detection performance on
few-shot classes. According to similar appearance (i.e., visual appearance,
shape, and limbs etc.) and environment in which objects often appear, the
category-based grouping mechanism splits categories into disjoint groups to
make similar semantic features more compact between categories within a group
and obtain more significant difference between groups, alleviating the strong
bias problem and further improving detection APs. The whole training consists
of the base model and the fine-tuning phases. According to grouping mechanism,
we group the meta-features vectors obtained by meta-model, so that the
distribution difference between groups is obvious, and the one within each
group is less. Extensive experiments on Pascal VOC dataset demonstrate that
ours which combines the TCL-C with category-based grouping significantly
outperforms previous state-of-the-art methods for few-shot detection. Compared
with previous competitive baseline, ours improves detection APs by almost 4%
for few-shot detection.
- Abstract(参考訳): 数ショット検出のためのメタ学習法が多数提案されている。
しかし、従来のほとんどの手法には2つの主な問題があり、検出の貧弱なAPと、不均衡と不十分なデータセットのため強いバイアスがある。
以前の研究は主に、追加のデータセット、マルチリレーションの注意機構、サブモジュールによってこれらの問題を緩和している。
しかし、よりコストがかかる。
本研究は,メタラーニングにおいて,カテゴリ間の関連性や非関連性に焦点をあてる。
そこで本研究では,分類タスクのためのTop-C分類損失(TL-C)とメタモデルから得られたカテゴリベースメタ機能のためのカテゴリベースグループ化機構を提案する。
TCL-Cは、真のラベル予測と最も可能性の高いC-1誤分類予測を利用して、少数クラスの検出性能を向上させる。
類似した外観(視覚的外観、形状、手足など)や、しばしば現れる物体の環境により、カテゴリベースのグループ化機構は、カテゴリを非結合群に分割し、グループ内のカテゴリ間で同様の意味的特徴をよりコンパクトにし、グループ間のより有意な差異を求め、強いバイアス問題を緩和し、さらに検出APを改善する。
トレーニング全体はベースモデルと微調整フェーズで構成されています。
グループ化機構により、メタモデルによって得られたメタ特徴ベクトルをグループ化することにより、グループ間の分布差が明らかとなり、各グループ内の分布差が小さくなる。
パスカルVOCデータセットの大規模な実験により、TCL-Cとカテゴリベースのグループ化を組み合わせた我々の実験は、過去の最先端の手法よりも、数ショット検出に優れていた。
従来の競合ベースラインと比較すると,数ショット検出ではAPがほぼ4%改善している。
関連論文リスト
- Queryable Prototype Multiple Instance Learning with Vision-Language Models for Incremental Whole Slide Image Classification [10.667645628712542]
本稿では, 逐次WSI分類に特化して設計された, Queryable Prototype Multiple Instance Learning (QPMIL-VL) を用いた視覚言語ベースのフレームワークを提案する。
TCGAデータセットの4つの実験により、我々のQPMIL-VLフレームワークが漸進的なWSI分類に有効であることが示された。
論文 参考訳(メタデータ) (2024-10-14T14:49:34Z) - MMCL: Boosting Deformable DETR-Based Detectors with Multi-Class Min-Margin Contrastive Learning for Superior Prohibited Item Detection [8.23801404004195]
X線画像における禁止項目検出は、最も効果的なセキュリティ検査方法の1つである。
X線画像における特異な現象が重なり合うと、前景と背景の特徴が結合する。
コンテンツクエリのカテゴリ意味情報を明らかにするために,Multi-class Min-Margin Contrastive Learning (MMCL)法を提案する。
論文 参考訳(メタデータ) (2024-06-05T12:07:58Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Mutual Exclusive Modulator for Long-Tailed Recognition [12.706961256329572]
ロングテール認識は、カテゴリー間で極めて不均衡なトレーニングサンプルを与えられた高性能分類器を学習するタスクである。
各グループに属する画像の確率を推定できる相互排他変調器を導入する。
提案手法は,最先端のベンチマークと比較すると,競争性能が向上する。
論文 参考訳(メタデータ) (2023-02-19T07:31:49Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Adaptive Class Suppression Loss for Long-Tail Object Detection [49.7273558444966]
アダプティブクラス抑圧損失(ACSL:Adaptive Class Suppression Loss)を考案し,尾部カテゴリの検出性能を改善する。
当社のACSLはResNet50-FPNで5.18%と5.2%の改善を実現し,新たな最先端技術を実現した。
論文 参考訳(メタデータ) (2021-04-02T05:12:31Z) - Model Patching: Closing the Subgroup Performance Gap with Data
Augmentation [50.35010342284508]
機械学習モデルの堅牢性を改善するためのフレームワークであるモデルパッチを導入する。
モデルパッチは、サブグループの違いに対してモデルを不変にすることを奨励し、サブグループによって共有されるクラス情報にフォーカスする。
CAMELは,(1)CycleGANを用いてクラス内およびサブグループ間拡張を学習し,(2)理論上動機付けられた整合性正規化器を用いてサブグループ性能のバランスをとる。
CAMELの有効性を3つのベンチマークデータセットで示し、最高のベースラインに対して、ロバストなエラーを最大33%削減した。
論文 参考訳(メタデータ) (2020-08-15T20:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。