論文の概要: Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection
- arxiv url: http://arxiv.org/abs/2305.08069v1
- Date: Sun, 14 May 2023 04:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 17:53:59.544918
- Title: Instance-Aware Repeat Factor Sampling for Long-Tailed Object Detection
- Title(参考訳): 長距離物体検出のための事例認識繰り返し因子サンプリング
- Authors: Burhaneddin Yaman, Tanvir Mahmud, Chun-Hao Liu
- Abstract要約: 現実世界のオブジェクト検出における不均衡なデータセットは、各クラスのインスタンス数に大きな差がある場合が多い。
本稿では,再サンプリングプロセスのインスタンス数とイメージ数を統一し,異なる視点を意識するIRFSを提案する。
提案手法は,LVIS v1.0ベンチマークデータセットにおいて有望な結果を示す。
- 参考スコア(独自算出の注目度): 3.4913694429616022
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an embarrassingly simple method -- instance-aware repeat factor
sampling (IRFS) to address the problem of imbalanced data in long-tailed object
detection. Imbalanced datasets in real-world object detection often suffer from
a large disparity in the number of instances for each class. To improve the
generalization performance of object detection models on rare classes, various
data sampling techniques have been proposed. Repeat factor sampling (RFS) has
shown promise due to its simplicity and effectiveness. Despite its efficiency,
RFS completely neglects the instance counts and solely relies on the image
count during re-sampling process. However, instance count may immensely vary
for different classes with similar image counts. Such variation highlights the
importance of both image and instance for addressing the long-tail
distributions. Thus, we propose IRFS which unifies instance and image counts
for the re-sampling process to be aware of different perspectives of the
imbalance in long-tailed datasets. Our method shows promising results on the
challenging LVIS v1.0 benchmark dataset over various architectures and
backbones, demonstrating their effectiveness in improving the performance of
object detection models on rare classes with a relative $+50\%$ average
precision (AP) improvement over counterpart RFS. IRFS can serve as a strong
baseline and be easily incorporated into existing long-tailed frameworks.
- Abstract(参考訳): 我々は,ロングテール物体検出における不均衡データ問題に対処するため,恥ずかしいほど簡単なインスタンス認識反復因子サンプリング(irfs)を提案する。
実世界のオブジェクト検出における不均衡データセットは、しばしば各クラスに対するインスタンス数の大きな差に苦しむ。
希少クラスにおける対象検出モデルの一般化性能を向上させるため,様々なデータサンプリング手法が提案されている。
繰り返し因子サンプリング(RFS)はその単純さと有効性から有望である。
RFSはその効率にもかかわらず、インスタンスカウントを完全に無視し、再サンプリングプロセス中のイメージカウントにのみ依存する。
しかし、同じ画像数を持つ異なるクラスでインスタンス数は大きく異なる可能性がある。
このようなバリエーションは、ロングテール分布に対処するためのイメージとインスタンスの両方の重要性を強調している。
そこで本研究では,ロングテールデータセットにおける不均衡の異なる視点を認識するために,再サンプリングプロセスのインスタンス数と画像数を統一するirfを提案する。
提案手法は,様々なアーキテクチャやバックボーン上でのLVIS v1.0ベンチマークデータセットに対する有望な結果を示し,RFSに対する相対的な平均精度(AP)が+50\%である希少クラスにおけるオブジェクト検出モデルの性能向上に有効であることを示す。
IRFSは強力なベースラインとして機能し、既存のロングテールフレームワークに簡単に組み込める。
関連論文リスト
- Long-Tailed Object Detection Pre-training: Dynamic Rebalancing Contrastive Learning with Dual Reconstruction [28.359463356384463]
2DRCL(Dynamic Rebalance Contrastive Learning with Dual Reconstruction)と呼ばれる,オブジェクト検出のための新たな事前学習フレームワークを導入する。
提案手法は,グローバルな文脈意味論と詳細な局所パターンの両方を捉えることによって,事前学習とオブジェクト検出を一致させる,ホロスティック・ローカル・コントラスト学習機構に基づいている。
COCOおよびLVIS v1.0データセットの実験により,本手法の有効性,特に末尾クラスにおけるmAP/APスコアの改善が示された。
論文 参考訳(メタデータ) (2024-11-14T13:59:01Z) - LeOCLR: Leveraging Original Images for Contrastive Learning of Visual Representations [4.680881326162484]
画像分類やオブジェクト検出などの下流タスクにおける教師あり学習よりも優れている。
対照的な学習における一般的な強化手法は、ランダムな収穫とそれに続くリサイズである。
本稿では,新しいインスタンス識別手法と適応型損失関数を用いたフレームワークであるLeOCLRを紹介する。
論文 参考訳(メタデータ) (2024-03-11T15:33:32Z) - Advancing Image Retrieval with Few-Shot Learning and Relevance Feedback [5.770351255180495]
Image Retrieval with Relevance Feedback (IRRF) は、検索プロセス中に反復的なヒューマンインタラクションを伴う。
本稿では,タスクに適したハイパーネットワークに基づく新しいスキームを提案し,ユーザフィードバックの迅速な調整を容易にする。
提案手法は,数発の1クラス分類でSoTAを達成でき,数発のオープンセット認識のバイナリ分類タスクで同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2023-12-18T10:20:28Z) - Feature Generation for Long-tail Classification [36.186909933006675]
そこで本研究では,テールカテゴリーの分布を推定して有意義な特徴を生成する方法を示す。
また、t-SNE視覚化を用いて生成した特徴の質的分析を行い、末尾クラス分布のキャリブレーションに最も近い隣人を解析する。
論文 参考訳(メタデータ) (2021-11-10T21:34:29Z) - FASA: Feature Augmentation and Sampling Adaptation for Long-Tailed
Instance Segmentation [91.129039760095]
ロングテールインスタンスセグメンテーションの最近の手法は、トレーニングデータが少ないレアオブジェクトクラスで未だに苦労している。
本稿では,FASA(Feature Augmentation and Smpling Adaptation)を提案する。
FASAは、標準またはロングテールのセグメンテーションフレームワークに簡単に接続できる、高速で汎用的な方法です。
論文 参考訳(メタデータ) (2021-02-25T14:07:23Z) - Towards Better Object Detection in Scale Variation with Adaptive Feature
Selection [3.5352273012717044]
チャネル次元の多レベル表現を融合する方法を自動学習する新しい適応的特徴選択モジュール(AFSM)を提案する。
これは、特徴ピラミッド構造を持つ検出器の性能を著しく向上させる。
クラス不均衡問題に対処するために,クラス対応サンプリング機構(CASM)を提案する。
論文 参考訳(メタデータ) (2020-12-06T13:41:20Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - MuCAN: Multi-Correspondence Aggregation Network for Video
Super-Resolution [63.02785017714131]
ビデオ超解像(VSR)は、複数の低解像度フレームを使用して、各フレームに対して高解像度の予測を生成することを目的としている。
フレーム間およびフレーム内は、時間的および空間的情報を利用するための鍵となるソースである。
VSRのための効果的なマルチ対応アグリゲーションネットワーク(MuCAN)を構築した。
論文 参考訳(メタデータ) (2020-07-23T05:41:27Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Overcoming Classifier Imbalance for Long-tail Object Detection with
Balanced Group Softmax [88.11979569564427]
本報告では, 長期分布前における最先端モデルの過小評価に関する最初の体系的解析を行う。
本稿では,グループワイドトレーニングを通じて検出フレームワーク内の分類器のバランスをとるための,新しいバランス付きグループソフトマックス(BAGS)モジュールを提案する。
非常に最近の長尾大語彙オブジェクト認識ベンチマークLVISの大規模な実験により,提案したBAGSは検出器の性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-06-18T10:24:26Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。