論文の概要: Attention Guided Cosine Margin For Overcoming Class-Imbalance in
Few-Shot Road Object Detection
- arxiv url: http://arxiv.org/abs/2111.06639v1
- Date: Fri, 12 Nov 2021 10:11:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 13:30:31.445757
- Title: Attention Guided Cosine Margin For Overcoming Class-Imbalance in
Few-Shot Road Object Detection
- Title(参考訳): 少数道路物体検出におけるクラス不均衡克服のための注意誘導コサインマージン
- Authors: Ashutosh Agarwal and Anay Majee and Anbumani Subramanian and Chetan
Arora
- Abstract要約: Few-shot Object Detection (FSOD)は、少数のデータサンプルのみを与えられた画像内のオブジェクトをローカライズし、分類する。
FSOD研究の最近の傾向は、破滅的な忘れ込みや階級混乱につながるメトリックとメタラーニング技術の採用を示している。
我々は、より厳密で適切に分離されたクラス固有の特徴クラスタの作成を容易にするAttention Guided Cosine Margin (AGCM)を紹介します。
- 参考スコア(独自算出の注目度): 5.821060995749903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) localizes and classifies objects in an image
given only a few data samples. Recent trends in FSOD research show the adoption
of metric and meta-learning techniques, which are prone to catastrophic
forgetting and class confusion. To overcome these pitfalls in metric learning
based FSOD techniques, we introduce Attention Guided Cosine Margin (AGCM) that
facilitates the creation of tighter and well separated class-specific feature
clusters in the classification head of the object detector. Our novel Attentive
Proposal Fusion (APF) module minimizes catastrophic forgetting by reducing the
intra-class variance among co-occurring classes. At the same time, the proposed
Cosine Margin Cross-Entropy loss increases the angular margin between confusing
classes to overcome the challenge of class confusion between already learned
(base) and newly added (novel) classes. We conduct our experiments on the
challenging India Driving Dataset (IDD), which presents a real-world
class-imbalanced setting alongside popular FSOD benchmark PASCAL-VOC. Our
method outperforms State-of-the-Art (SoTA) approaches by up to 6.4 mAP points
on the IDD-OS and up to 2.0 mAP points on the IDD-10 splits for the 10-shot
setting. On the PASCAL-VOC dataset, we outperform existing SoTA approaches by
up to 4.9 mAP points.
- Abstract(参考訳): Few-shot Object Detection (FSOD)は、少数のデータサンプルのみを与えられた画像内のオブジェクトをローカライズし、分類する。
FSOD研究の最近の傾向は、破滅的な忘れ込みや階級混乱につながるメトリックとメタラーニング技術の採用を示している。
メトリクス学習に基づくfsod手法におけるこれらの落とし穴を克服するために,オブジェクト検出器の分類ヘッドにおいて,より密接かつ明確に分離されたクラス特異的特徴クラスタの作成を容易にする注意誘導コサインマージン(agcm)を導入する。
提案モジュールは,共起クラス間のクラス内分散を低減し,破滅的忘れを最小化する。
同時に、提案されたコサインマージンクロスエントロピー損失は、既に学習された(ベース)クラスと新しく追加された(ノベル)クラスの間のクラス混乱の課題を克服するために、混乱クラス間の角マージンを増加させる。
我々は、人気のあるFSODベンチマークPASCAL-VOCと並行して、現実世界のクラス不均衡設定を示す、挑戦的なIndia Driving Dataset(IDD)について実験を行った。
提案手法は,IDD-OSでは最大6.4mAP,IDD-10では最大2.0mAP,SoTAでは最大10ショット設定では最大2。
PASCAL-VOCデータセットでは、既存のSoTAアプローチを最大4.9mAPポイントで上回ります。
関連論文リスト
- SMILe: Leveraging Submodular Mutual Information For Robust Few-Shot Object Detection [2.0755366440393743]
Few-Shot Object Detection (FSOD) において、オブジェクトクラスの融合と忘れは重要な課題である。
本稿では,相互情報機能を導入した新しいサブモジュール型相互情報学習フレームワークを提案する。
提案手法は,バックボーンアーキテクチャに依存しないFSODの既存手法に一般化する。
論文 参考訳(メタデータ) (2024-07-02T20:53:43Z) - Bayesian Learning-driven Prototypical Contrastive Loss for Class-Incremental Learning [42.14439854721613]
本稿では,クラス増分学習シナリオに特化して,ベイズ学習駆動型コントラスト損失(BLCL)を持つプロトタイプネットワークを提案する。
提案手法は,ベイズ学習手法を用いて,クロスエントロピーとコントラスト損失関数のバランスを動的に適用する。
論文 参考訳(メタデータ) (2024-05-17T19:49:02Z) - Controllable Relation Disentanglement for Few-Shot Class-Incremental Learning [82.79371269942146]
本稿では,FewShot Class-Incremental Learning (FSCIL) を新たな視点,すなわち関係の絡み合いから扱うことを提案する。
急激な相関関係を切り離すことの課題は、FSCILの制御性が悪いことである。
我々は、CTRL-FSCIL(Controllable Relation-disentang FewShot Class-Incremental Learning)と呼ばれる、新しいシンプルな効果のある手法を提案する。
論文 参考訳(メタデータ) (2024-03-17T03:16:59Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Few-shot Object Detection with Refined Contrastive Learning [4.520231308678286]
Refined Contrastive Learning (FSRC) を用いた新しい複数ショットオブジェクト検出法を提案する。
コンフリブルクラスを含む新しいクラスからResemblance Groupを見つけるために、事前決定コンポーネントが導入された。
RCLはクラス間の距離を増やすために、このクラスのグループで指摘される。
論文 参考訳(メタデータ) (2022-11-24T09:34:20Z) - Zero-Shot Temporal Action Detection via Vision-Language Prompting [134.26292288193298]
視覚言語プロンプト(STALE)を用いた新しいゼロショット時間行動検出モデルを提案する。
我々のモデルは最先端の代替品を著しく上回っている。
我々のモデルは、近年の強力な競合相手よりも監督的TADにおいて優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-07-17T13:59:46Z) - Continual Learning For On-Device Environmental Sound Classification [63.81276321857279]
デバイス上での環境音の分類のための簡易かつ効率的な連続学習法を提案する。
本手法は,サンプルごとの分類の不確実性を測定することにより,トレーニングの履歴データを選択する。
論文 参考訳(メタデータ) (2022-07-15T12:13:04Z) - Spacing Loss for Discovering Novel Categories [72.52222295216062]
新たなクラスディスカバリ(NCD)は、マシンラーニングモデルがラベルのないデータからインスタンスを意味的にグループ化する、学習パラダイムである。
まず,ラベル付きデータとラベルなしデータを併用する必要があるかどうかに基づいて,既存のNCD手法を1段階および2段階の手法に特徴付ける。
多次元スケーリングのキューを用いて、潜在空間における分離性を強制する単純で強力な損失関数を考案する。
論文 参考訳(メタデータ) (2022-04-22T09:37:11Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - Meta Guided Metric Learner for Overcoming Class Confusion in Few-Shot
Road Object Detection [0.3867363075280544]
Few-Shot Object Detection技術は、既存のベースオブジェクトクラスからの知識を拡張して、新しいロードオブジェクトを学習する。
FSODにおけるクラス混乱を克服する新しいメタガイドメトリック(MGML)を提案する。
本手法は,インド・ドライビング・ラーナー・データセット上でのFSOD(State-of-the-Art)アプローチよりも優れている。
論文 参考訳(メタデータ) (2021-10-28T12:51:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。