論文の概要: A Realistic Protocol for Evaluation of Weakly Supervised Object Localization
- arxiv url: http://arxiv.org/abs/2404.10034v2
- Date: Mon, 12 Aug 2024 00:39:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 23:17:20.173554
- Title: A Realistic Protocol for Evaluation of Weakly Supervised Object Localization
- Title(参考訳): 弱監視対象の局所化評価のための現実的プロトコル
- Authors: Shakeeb Murtaza, Soufiane Belharbi, Marco Pedersoli, Eric Granger,
- Abstract要約: Weakly Supervised Object Localization (WSOL)は、グローバルクラスレベルラベルのみを使用して、分類とローカライゼーションのためのディープラーニングモデルのトレーニングを可能にする。
我々は、手動のbboxアノテーションを必要とせずにLOC情報を提供する新しいWSOL評価プロトコルを提案する。
実験の結果,提案した疑似ボックスを検証に利用することで,モデル選択としきい値推定が容易であることがわかった。
- 参考スコア(独自算出の注目度): 13.412674368913747
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly Supervised Object Localization (WSOL) allows training deep learning models for classification and localization (LOC) using only global class-level labels. The absence of bounding box (bbox) supervision during training raises challenges in the literature for hyper-parameter tuning, model selection, and evaluation. WSOL methods rely on a validation set with bbox annotations for model selection, and a test set with bbox annotations for threshold estimation for producing bboxes from localization maps. This approach, however, is not aligned with the WSOL setting as these annotations are typically unavailable in real-world scenarios. Our initial empirical analysis shows a significant decline in LOC performance when model selection and threshold estimation rely solely on class labels and the image itself, respectively, compared to using manual bbox annotations. This highlights the importance of incorporating bbox labels for optimal model performance. In this paper, a new WSOL evaluation protocol is proposed that provides LOC information without the need for manual bbox annotations. In particular, we generated noisy pseudo-boxes from a pretrained off-the-shelf region proposal method such as Selective Search, CLIP, and RPN for model selection. These bboxes are also employed to estimate the threshold from LOC maps, circumventing the need for test-set bbox annotations. Our experiments with several WSOL methods on ILSVRC and CUB datasets show that using the proposed pseudo-bboxes for validation facilitates the model selection and threshold estimation, with LOC performance comparable to those selected using GT bboxes on the validation set and threshold estimation on the test set. It also outperforms models selected using class-level labels, and then dynamically thresholded based solely on LOC maps.
- Abstract(参考訳): Weakly Supervised Object Localization (WSOL)は、グローバルなクラスレベルのラベルのみを使用して、分類とローカライゼーション(LOC)のためのディープラーニングモデルのトレーニングを可能にする。
トレーニング中のバウンディングボックス(bbox)の監督が欠如していることは、ハイパーパラメータチューニング、モデル選択、評価に関する文献の課題を提起する。
WSOLメソッドは、モデル選択のためのbboxアノテーションを備えた検証セットと、ローカライゼーションマップからbboxを生成するためのしきい値推定のためのbboxアノテーションを備えたテストセットに依存している。
しかし、このアプローチはWSOLの設定と一致していない。
モデル選択としきい値推定がそれぞれクラスラベルと画像自体に依存している場合のLOC性能は,手動のbboxアノテーションと比較して有意に低下した。
このことは、最適なモデルパフォーマンスのためにbboxラベルを組み込むことの重要性を強調している。
本稿では,手動のbboxアノテーションを必要とせずにLOC情報を提供する新しいWSOL評価プロトコルを提案する。
特に,モデル選択のためのSelective Search, CLIP, RPNなどの事前訓練済みオフザシェルフ領域提案手法から,ノイズの多い擬似ボックスを生成した。
これらのbboxはLOCマップからしきい値を推定するためにも使われ、テストセットのbboxアノテーションの必要性を回避する。
ILSVRC と CUB のデータセットに対する WSOL 手法による実験により,提案した疑似ボックスを用いた検証により,モデル選択としきい値推定が容易であることが確認された。
また、クラスレベルのラベルを使用して選択されたモデルよりも優れ、LOCマップのみに基づいて動的に閾値付けされる。
関連論文リスト
- SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,DA手法の評価と,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの公平な評価を行うフレームワークを提案する。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - Classification Tree-based Active Learning: A Wrapper Approach [4.706932040794696]
本稿では,木構造にサンプリングプロセスを整理し,分類のためのラッパー能動的学習法を提案する。
ラベル付き標本の初期集合上に構築された分類木は、空間を低エントロピー領域に分解すると考えられる。
この適応は、既存のアクティブラーニング手法よりも大幅に向上することが証明されている。
論文 参考訳(メタデータ) (2024-04-15T17:27:00Z) - A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - One-bit Supervision for Image Classification: Problem, Solution, and
Beyond [114.95815360508395]
本稿では,ラベルの少ない新しい学習環境である,画像分類のための1ビット監督について述べる。
多段階学習パラダイムを提案し、負ラベル抑圧を半教師付き半教師付き学習アルゴリズムに組み込む。
複数のベンチマークにおいて、提案手法の学習効率は、フルビットの半教師付き監視手法よりも優れている。
論文 参考訳(メタデータ) (2023-11-26T07:39:00Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - Semi-supervised 3D Object Detection with Proficient Teachers [114.54835359657707]
自律運転のシナリオにおけるクラウドベースの3Dオブジェクト検出器の優位性は、大量の正確なラベル付きサンプルに大きく依存している。
Pseudo-Labeling法はSSLフレームワークで一般的に使用されているが、教師モデルの低品質な予測は、その性能を著しく制限している。
そこで本研究では,教師モデルをさらに高度化することで,半教師付き3次元物体検出のためのPseudo-Labelingフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-26T04:54:03Z) - Dynamic Label Assignment for Object Detection by Combining Predicted and
Anchor IoUs [20.41563386339572]
本稿では,予測付きトレーニング状況に基づいてラベル割り当てを動的に行うための,シンプルで効果的な手法を提案する。
本手法は,適応ラベル代入アルゴリズムによる検出モデルの性能改善を示す。
論文 参考訳(メタデータ) (2022-01-23T23:14:07Z) - Boosting Weakly Supervised Object Detection via Learning Bounding Box
Adjusters [76.36104006511684]
高価なインスタンスレベルのオブジェクトアノテーションを避けるため、WSOD(Weakly-supervised Object Detection)が最近の話題として登場した。
我々は、よく注釈付けされた補助データセットからバウンディングボックス回帰知識を活用することにより、ローカライズ性能を向上させるための問題設定を擁護する。
提案手法は,WSOD法と知識伝達モデルに対して,同様の問題設定で良好に機能する。
論文 参考訳(メタデータ) (2021-08-03T13:38:20Z) - Probabilistic Anchor Assignment with IoU Prediction for Object Detection [9.703212439661097]
オブジェクト検出では、どのアンカーを正または負のサンプルとして割り当てるか、すなわちアンカー代入(アンカー代入)がモデルの性能に大きく影響を与えるコアプロシージャとして明らかにされている。
本稿では,モデルの学習状況に応じて,アンカーを正と負のサンプルに適応的に分離する新しいアンカー代入戦略を提案する。
論文 参考訳(メタデータ) (2020-07-16T04:26:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。