論文の概要: Fractal Calibration for long-tailed object detection
- arxiv url: http://arxiv.org/abs/2410.11774v1
- Date: Tue, 15 Oct 2024 16:55:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 14:02:05.021440
- Title: Fractal Calibration for long-tailed object detection
- Title(参考訳): 長距離物体検出のためのフラクタル校正
- Authors: Konstantinos Panagiotis Alexandridis, Ismail Elezi, Jiankang Deng, Anh Nguyen, Shan Luo,
- Abstract要約: 実世界のデータセットは不均衡な分布を辿り、希少なカテゴリーのオブジェクト検出において大きな課題を生じさせる。
近年の研究では、データセットのクラスを利用する再重み付けと再サンプリング手法の開発によってこの問題に対処している。
FRActal CALibration(FRACAL)を提案する。
- 参考スコア(独自算出の注目度): 33.23556625821267
- License:
- Abstract: Real-world datasets follow an imbalanced distribution, which poses significant challenges in rare-category object detection. Recent studies tackle this problem by developing re-weighting and re-sampling methods, that utilise the class frequencies of the dataset. However, these techniques focus solely on the frequency statistics and ignore the distribution of the classes in image space, missing important information. In contrast to them, we propose FRActal CALibration (FRACAL): a novel post-calibration method for long-tailed object detection. FRACAL devises a logit adjustment method that utilises the fractal dimension to estimate how uniformly classes are distributed in image space. During inference, it uses the fractal dimension to inversely downweight the probabilities of uniformly spaced class predictions achieving balance in two axes: between frequent and rare categories, and between uniformly spaced and sparsely spaced classes. FRACAL is a post-processing method and it does not require any training, also it can be combined with many off-the-shelf models such as one-stage sigmoid detectors and two-stage instance segmentation models. FRACAL boosts the rare class performance by up to 8.6% and surpasses all previous methods on LVIS dataset, while showing good generalisation to other datasets such as COCO, V3Det and OpenImages. The code will be released.
- Abstract(参考訳): 実世界のデータセットは不均衡な分布を辿り、希少なカテゴリーのオブジェクト検出において大きな課題を生じさせる。
最近の研究は、データセットのクラス周波数を利用する再重み付けと再サンプリング手法を開発することでこの問題に対処している。
しかし、これらの手法は周波数統計にのみ焦点をあて、画像空間におけるクラスの分布を無視し、重要な情報を欠いている。
これとは対照的に、長い尾の物体検出のための新しい校正法であるFRActal CALibration (FRACAL)を提案する。
FRACALはフラクタル次元を利用するロジット調整法を考案し、画像空間におけるクラスの一様分布を推定する。
推論の間、フラクタル次元を用いて、頻繁なカテゴリと希少なカテゴリの間のバランスを達成する一様空間のクラス予測の確率を逆さまに下げ、一様空間のクラスと疎小空間のクラスの間でバランスをとる。
FRACALは後処理法であり、いかなる訓練も必要とせず、一段シグモイド検出器や二段インスタンスセグメンテーションモデルといった多くの市販モデルと組み合わせることができる。
FRACALは、レアクラスのパフォーマンスを最大8.6%向上し、LVISデータセットのすべてのメソッドを上回り、COCO、V3Det、OpenImagesといった他のデータセットへの優れた一般化を示している。
コードはリリースされます。
関連論文リスト
- SMCL: Saliency Masked Contrastive Learning for Long-tailed Recognition [19.192861880360347]
本稿では,偏見予測の問題を緩和するために,相反学習を隠蔽するサリエンシを提案する。
我々のキーとなる考え方は、画像の重要な部分を塩分濃度検出を用いてマスキングし、対照的な学習を用いて、マスクされた画像を特徴空間の小さなクラスへ移動させることである。
実験結果から,提案手法は,ベンチマーク長尾データセット上での最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2024-06-04T11:33:40Z) - Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.70453964041718]
細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-03-11T13:44:49Z) - Adjusting Logit in Gaussian Form for Long-Tailed Visual Recognition [37.62659619941791]
特徴レベルの観点から、長い尾の視覚認識の問題について検討する。
2つの新しいロジット調整法が提案され,計算オーバーヘッドの緩やかなモデル性能が向上した。
ベンチマークデータセットを用いて行った実験は,提案手法の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-18T02:06:06Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - GDC- Generalized Distribution Calibration for Few-Shot Learning [5.076419064097734]
大規模なラベル付きデータセットを組み立てるのにかなりの時間と労力を要するため、機械学習において重要な問題となるショットラーニングはほとんどない。
ほとんどの少数ショット学習アルゴリズムは、2つの制限の1つに悩まされている。
そこで本研究では,全大クラスの重み付きランダム変数として分類する際,少数ショット分布を推定する一般サンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-04-11T16:22:53Z) - On Model Calibration for Long-Tailed Object Detection and Instance
Segmentation [56.82077636126353]
NorCal, Normalized for long-tailed object detection and instance segmentation。
バックグラウンドクラスを個別に扱い、各提案のクラスに対してスコアを正規化することは、優れたパフォーマンスを達成するための鍵であることを示す。
論文 参考訳(メタデータ) (2021-07-05T17:57:20Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - ResLT: Residual Learning for Long-tailed Recognition [64.19728932445523]
本稿では,パラメータ空間の側面から,より基本的なロングテール認識の視点を提案する。
すべてのクラスから画像を認識するために最適化されたメインブランチと、medium+tailクラスとtailクラスからのイメージを強化するために徐々に2つの残りのブランチを融合して最適化する。
我々は、CIFAR-10、CIFAR-100、Places、ImageNet、iNaturalist 2018の長期バージョンであるいくつかのベンチマークでこの方法をテストする。
論文 参考訳(メタデータ) (2021-01-26T08:43:50Z) - Variational Clustering: Leveraging Variational Autoencoders for Image
Clustering [8.465172258675763]
変分オートエンコーダ(VAE)は、潜在空間におけるデータ分布の学習に自然に役立ちます。
画像のクラスタリングに先立ってガウス混合を用いるVAEに基づく手法を提案する。
提案手法は,画像の潜伏分布と後部を捉える前処理を同時に学習し,データポイント間の識別に役立てる。
論文 参考訳(メタデータ) (2020-05-10T09:34:48Z) - Rethinking Class-Balanced Methods for Long-Tailed Visual Recognition
from a Domain Adaptation Perspective [98.70226503904402]
現実世界のオブジェクトの周波数は、しばしば電力法則に従い、長い尾のクラス分布を持つデータセット間のミスマッチを引き起こす。
メタラーニング手法を用いて,クラス条件分布の違いを明示的に推定し,古典的なクラスバランス学習を強化することを提案する。
論文 参考訳(メタデータ) (2020-03-24T11:28:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。