論文の概要: Coreset Selection for Object Detection
- arxiv url: http://arxiv.org/abs/2404.09161v1
- Date: Sun, 14 Apr 2024 06:46:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-16 15:17:37.421480
- Title: Coreset Selection for Object Detection
- Title(参考訳): オブジェクト検出のためのコアセット選択
- Authors: Hojun Lee, Suyoung Kim, Junhoo Lee, Jaeyoung Yoo, Nojun Kwak,
- Abstract要約: Coreset selectionは、データセット全体の小さな代表サブセットを選択する方法である。
我々は新しいアプローチであるCoreset Selection for Object Detection (CSOD)を導入する。
CSODは、画像内の同じクラスの複数のオブジェクトに対して、画像的に、クラス的に代表的な特徴ベクトルを生成する。
CSOD を Pascal VOC データセットで評価すると,200 枚の画像を選択すると,AP$_50$ において CSOD はランダム選択を+6.4% 上回った。
- 参考スコア(独自算出の注目度): 25.71486185893705
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coreset selection is a method for selecting a small, representative subset of an entire dataset. It has been primarily researched in image classification, assuming there is only one object per image. However, coreset selection for object detection is more challenging as an image can contain multiple objects. As a result, much research has yet to be done on this topic. Therefore, we introduce a new approach, Coreset Selection for Object Detection (CSOD). CSOD generates imagewise and classwise representative feature vectors for multiple objects of the same class within each image. Subsequently, we adopt submodular optimization for considering both representativeness and diversity and utilize the representative vectors in the submodular optimization process to select a subset. When we evaluated CSOD on the Pascal VOC dataset, CSOD outperformed random selection by +6.4%p in AP$_{50}$ when selecting 200 images.
- Abstract(参考訳): Coreset selectionは、データセット全体の小さな代表サブセットを選択する方法である。
主に画像分類において研究されており、画像ごとに1つの物体しか存在しないと仮定している。
しかし、画像が複数のオブジェクトを含むことができるため、オブジェクト検出のためのコアセットの選択はより困難である。
結果として、この話題についてはまだ多くの研究がなされていない。
そこで我々は新しいアプローチであるCoreset Selection for Object Detection (CSOD)を導入する。
CSODは、画像内の同じクラスの複数のオブジェクトに対して、画像的に、クラス的に代表的な特徴ベクトルを生成する。
その後、代表性と多様性の両方を考慮した部分モジュラ最適化を採用し、部分モジュラ最適化プロセスにおける代表ベクトルを用いてサブセットを選択する。
CSOD を Pascal VOC データセットで評価すると, CSOD は 200 枚の画像を選択する場合, AP$_{50}$ のランダム選択を +6.4% 上回った。
関連論文リスト
- Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation [10.416673784744281]
本稿では,複数の参照画像特徴を対応オブジェクトにマージする重み付きマージ手法を提案する。
提案手法は,マルチオブジェクト・パーソナライズされた画像生成のためのConcept101データセットとDreamBoothデータセットの最先端技術よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2024-09-26T15:04:13Z) - Classification Committee for Active Deep Object Detection [24.74839931613233]
本稿では,アクティブディープオブジェクト検出のための分類委員会を提案する。
委員会は、その不確実性値に基づいて最も情報性の高い画像を選択する。
本手法は,最先端の能動学習法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-16T16:31:36Z) - Unicom: Universal and Compact Representation Learning for Image
Retrieval [65.96296089560421]
大規模LAION400Mを,CLIPモデルにより抽出された共同テキストと視覚的特徴に基づいて,100万の擬似クラスにクラスタリングする。
このような矛盾を緩和するために、我々は、マージンベースのソフトマックス損失を構築するために、ランダムにクラス間の部分的なプロトタイプを選択する。
提案手法は,複数のベンチマークにおいて,教師なし,教師なしの画像検索手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-12T14:25:52Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Disambiguation of One-Shot Visual Classification Tasks: A Simplex-Based
Approach [8.436437583394998]
本稿では,複数の物体の存在を検出するための戦略を提案する。
この戦略は、高次元空間における単純体の角を識別することに基づいている。
提案手法は,極端設定における精度をわずかながら統計的に向上させる能力を示す。
論文 参考訳(メタデータ) (2023-01-16T11:37:05Z) - Matching Feature Sets for Few-Shot Image Classification [22.84472344406448]
セットベースの表現は本質的に、ベースクラスからの画像のよりリッチな表現を構築します。
私たちのアプローチは、SetFeatと呼ばれ、既存のエンコーダアーキテクチャに浅い自己アテンションメカニズムを組み込んでいます。
論文 参考訳(メタデータ) (2022-04-02T22:42:54Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Collaging Class-specific GANs for Semantic Image Synthesis [68.87294033259417]
本稿では,高分解能なセマンティック画像合成のための新しい手法を提案する。
1つのベースイメージジェネレータと複数のクラス固有のジェネレータで構成される。
実験により,本手法は高解像度で高品質な画像を生成することができることが示された。
論文 参考訳(メタデータ) (2021-10-08T17:46:56Z) - EMDS-5: Environmental Microorganism Image Dataset Fifth Version for
Multiple Image Analysis Tasks [17.30000857725502]
GTS-5データセットには21種類のEMがあり、それぞれが20個のオリジナルEMイメージ、20個のシングルオブジェクトGTイメージ、20個のマルチオブジェクトGTイメージを含んでいる。
s-5は、画像前処理、画像分割、特徴抽出、画像分類、画像検索機能を評価することができる。
論文 参考訳(メタデータ) (2021-02-20T15:27:05Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z) - Multi-Channel Attention Selection GANs for Guided Image-to-Image
Translation [148.9985519929653]
本稿では,画像から画像への変換のためのマルチチャネルアテンション選択生成支援ネットワーク(SelectionGAN)を提案する。
提案するフレームワークとモジュールは統合されたソリューションであり、セマンティック画像合成などの他の生成タスクに応用できる。
論文 参考訳(メタデータ) (2020-02-03T23:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。