論文の概要: Pursuing Better Decision Boundaries for Long-Tailed Object Detection via Category Information Amount
- arxiv url: http://arxiv.org/abs/2502.03852v1
- Date: Thu, 06 Feb 2025 08:08:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:33:56.493053
- Title: Pursuing Better Decision Boundaries for Long-Tailed Object Detection via Category Information Amount
- Title(参考訳): カテゴリー情報量による長距離物体検出のためのより良い決定境界の提案
- Authors: Yanbiao Ma, Wei Dai, Jiayi Chen,
- Abstract要約: オブジェクト検出では、通常、データセットが長いテール分布を示すかどうかを定義するためにインスタンスカウントが使用される。
この仮定は、不均衡なインスタンス数を持つデータセットのカテゴリバイアスに関する広範な研究につながった。
本稿では,情報量に基づいて各カテゴリの決定空間を動的に調整するために,IGAMロス(Information Amount-Guided Angular Margin)を提案する。
- 参考スコア(独自算出の注目度): 6.745949254672713
- License:
- Abstract: In object detection, the instance count is typically used to define whether a dataset exhibits a long-tail distribution, implicitly assuming that models will underperform on categories with fewer instances. This assumption has led to extensive research on category bias in datasets with imbalanced instance counts. However, models still exhibit category bias even in datasets where instance counts are relatively balanced, clearly indicating that instance count alone cannot explain this phenomenon. In this work, we first introduce the concept and measurement of category information amount. We observe a significant negative correlation between category information amount and accuracy, suggesting that category information amount more accurately reflects the learning difficulty of a category. Based on this observation, we propose Information Amount-Guided Angular Margin (IGAM) Loss. The core idea of IGAM is to dynamically adjust the decision space of each category based on its information amount, thereby reducing category bias in long-tail datasets. IGAM Loss not only performs well on long-tailed benchmark datasets such as LVIS v1.0 and COCO-LT but also shows significant improvement for underrepresented categories in the non-long-tailed dataset Pascal VOC. Comprehensive experiments demonstrate the potential of category information amount as a tool and the generality of our proposed method.
- Abstract(参考訳): オブジェクト検出では、通常、インスタンスカウントは、データセットが長いテール分布を示すかどうかを定義するために使用され、モデルがインスタンスが少ないカテゴリで過小評価されることを暗黙的に仮定する。
この仮定は、不均衡なインスタンス数を持つデータセットのカテゴリバイアスに関する広範な研究につながった。
しかしながら、モデルが比較的バランスの取れたデータセットでさえもカテゴリバイアスを示しており、インスタンスカウントだけでもこの現象を説明できないことが明確に示されている。
本稿ではまず,カテゴリ情報量の概念と測定について紹介する。
カテゴリー情報量と精度の間に有意な負の相関関係を観察し,カテゴリ情報の量はカテゴリの学習困難をより正確に反映していることを示す。
そこで本研究では,IGAM(Information Amount-Guided Angular Margin)ロスを提案する。
IGAMの中核となる考え方は、情報量に基づいて各カテゴリの決定空間を動的に調整し、ロングテールデータセットにおけるカテゴリバイアスを低減することである。
IGAM Loss は LVIS v1.0 や COCO-LT のようなロングテールのベンチマークデータセットでよく機能するだけでなく、非ロングテールのデータセット Pascal VOC では未表現のカテゴリでも大幅に改善されている。
総合的な実験により,ツールとしてのカテゴリ情報量の可能性と提案手法の汎用性を示す。
関連論文リスト
- Unleashing the Potential of Model Bias for Generalized Category Discovery [9.552403124453614]
一般化カテゴリー発見(Generalized Category Discovery)は、既知のカテゴリーと未定義のカテゴリの両方を特定することを目的とした重要なタスクである。
主な課題は、既知のカテゴリのみに対する事前学習によって引き起こされるモデルバイアスと、新しいカテゴリに対する正確な監督の欠如である。
本稿では,これらの課題に対処するため,SDC(Self-Debiasing)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-17T03:05:27Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Mutual Exclusive Modulator for Long-Tailed Recognition [12.706961256329572]
ロングテール認識は、カテゴリー間で極めて不均衡なトレーニングサンプルを与えられた高性能分類器を学習するタスクである。
各グループに属する画像の確率を推定できる相互排他変調器を導入する。
提案手法は,最先端のベンチマークと比較すると,競争性能が向上する。
論文 参考訳(メタデータ) (2023-02-19T07:31:49Z) - DropLoss for Long-Tail Instance Segmentation [56.162929199998075]
珍しいカテゴリーと頻繁なカテゴリーのアンバランスを補う新しい適応損失であるDropLossを開発しています。
LVISデータセットでは,レア,一般的,頻繁なカテゴリにまたがる最先端のmAPを示す。
論文 参考訳(メタデータ) (2021-04-13T17:59:22Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - Seesaw Loss for Long-Tailed Instance Segmentation [131.86306953253816]
本稿では,各カテゴリの正試料と負試料の動的再バランス勾配を求めるシーソー損失を提案する。
緩和因子は、異なるカテゴリ間の累積トレーニングインスタンスの比率に比例して、罰を尾のカテゴリに還元する。
補償係数は、末尾カテゴリーの偽陽性を避けるために、誤分類されたインスタンスのペナルティを増加させる。
論文 参考訳(メタデータ) (2020-08-23T12:44:45Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。