論文の概要: Overcoming Classifier Imbalance for Long-tail Object Detection with
Balanced Group Softmax
- arxiv url: http://arxiv.org/abs/2006.10408v1
- Date: Thu, 18 Jun 2020 10:24:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 09:51:18.555943
- Title: Overcoming Classifier Imbalance for Long-tail Object Detection with
Balanced Group Softmax
- Title(参考訳): 平衡群ソフトマックスを用いたロングテール物体検出のための分類器不均衡の克服
- Authors: Yu Li, Tao Wang, Bingyi Kang, Sheng Tang, Chunfeng Wang, Jintao Li,
Jiashi Feng
- Abstract要約: 本報告では, 長期分布前における最先端モデルの過小評価に関する最初の体系的解析を行う。
本稿では,グループワイドトレーニングを通じて検出フレームワーク内の分類器のバランスをとるための,新しいバランス付きグループソフトマックス(BAGS)モジュールを提案する。
非常に最近の長尾大語彙オブジェクト認識ベンチマークLVISの大規模な実験により,提案したBAGSは検出器の性能を著しく向上することが示された。
- 参考スコア(独自算出の注目度): 88.11979569564427
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Solving long-tail large vocabulary object detection with deep learning based
models is a challenging and demanding task, which is however under-explored.In
this work, we provide the first systematic analysis on the underperformance of
state-of-the-art models in front of long-tail distribution. We find existing
detection methods are unable to model few-shot classes when the dataset is
extremely skewed, which can result in classifier imbalance in terms of
parameter magnitude. Directly adapting long-tail classification models to
detection frameworks can not solve this problem due to the intrinsic difference
between detection and classification.In this work, we propose a novel balanced
group softmax (BAGS) module for balancing the classifiers within the detection
frameworks through group-wise training. It implicitly modulates the training
process for the head and tail classes and ensures they are both sufficiently
trained, without requiring any extra sampling for the instances from the tail
classes.Extensive experiments on the very recent long-tail large vocabulary
object recognition benchmark LVIS show that our proposed BAGS significantly
improves the performance of detectors with various backbones and frameworks on
both object detection and instance segmentation. It beats all state-of-the-art
methods transferred from long-tail image classification and establishes new
state-of-the-art.Code is available at
https://github.com/FishYuLi/BalancedGroupSoftmax.
- Abstract(参考訳): 深層学習に基づくモデルを用いた長文大語彙物体検出は難易度の高い課題であり,未検討の課題である。本研究では,長文分布に先立つ最先端モデルの性能低下に関する最初の体系的分析を行う。
既存の検出手法では,データセットが極度に歪んだ場合,少数のクラスをモデル化できないことが判明した。
本研究は,検出と分類に本質的な違いがあるため,検出フレームワークにロングテール分類モデルを直接適用しても,この問題は解決できない。本研究では,グループ学習を通じて検出フレームワーク内の分類器のバランスをとるための,新しいバランスグループソフトマックス(bags)モジュールを提案する。
これは、頭と尾のクラスのトレーニングプロセスを暗黙的に調整し、尾のクラスからインスタンスのサンプリングを余分に必要とせずに、両者が十分に訓練されていることを保証する。最近のlong-tail large vocabulary object recognition benchmark lvisにおける拡張実験により、提案するバッグは、様々なバックボーンと、オブジェクト検出とインスタンスセグメンテーションの両方のフレームワークを備えた検出器の性能を大幅に改善していることが示された。
ロングテール画像分類から転送されるすべての最先端メソッドを破り、https://github.com/FishYuLi/BalancedGroupSoftmax.orgで新しい最先端コードを確立する。
関連論文リスト
- Investigating Self-Supervised Methods for Label-Efficient Learning [27.029542823306866]
低撮影能力のためのコントラスト学習、クラスタリング、マスク付き画像モデリングなど、さまざまな自己教師付きプレテキストタスクについて検討する。
マスク画像モデリングとクラスタリングの両方をプリテキストタスクとして含むフレームワークを導入する。
実規模データセット上でモデルをテストした場合,マルチクラス分類,マルチラベル分類,セマンティックセマンティックセグメンテーションにおける性能向上を示す。
論文 参考訳(メタデータ) (2024-06-25T10:56:03Z) - On Model Calibration for Long-Tailed Object Detection and Instance
Segmentation [56.82077636126353]
NorCal, Normalized for long-tailed object detection and instance segmentation。
バックグラウンドクラスを個別に扱い、各提案のクラスに対してスコアを正規化することは、優れたパフォーマンスを達成するための鍵であることを示す。
論文 参考訳(メタデータ) (2021-07-05T17:57:20Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - The Devil is the Classifier: Investigating Long Tail Relation
Classification with Decoupling Analysis [36.298869931803836]
ロングテール関係分類は、ヘッドクラスがトレーニングフェーズを支配しているため、難しい問題である。
そこで本研究では,関係を自動的に集約することで,ソフトウェイトを割り当てる,注意関係ルーティング付きロバストな分類器を提案する。
論文 参考訳(メタデータ) (2020-09-15T12:47:00Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。