論文の概要: Constrained Sampling for Class-Agnostic Weakly Supervised Object
Localization
- arxiv url: http://arxiv.org/abs/2209.09195v1
- Date: Fri, 9 Sep 2022 19:58:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 17:32:15.348508
- Title: Constrained Sampling for Class-Agnostic Weakly Supervised Object
Localization
- Title(参考訳): クラス非依存型弱教師付き物体定位のための制約サンプリング
- Authors: Shakeeb Murtaza, Soufiane Belharbi, Marco Pedersoli, Aydin Sarraf,
Eric Granger
- Abstract要約: 自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
- 参考スコア(独自算出の注目度): 10.542859578763068
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised vision transformers can generate accurate localization maps
of the objects in an image. However, since they decompose the scene into
multiple maps containing various objects, and they do not rely on any explicit
supervisory signal, they cannot distinguish between the object of interest from
other objects, as required in weakly-supervised object localization (WSOL). To
address this issue, we propose leveraging the multiple maps generated by the
different transformer heads to acquire pseudo-labels for training a WSOL model.
In particular, a new discriminative proposals sampling method is introduced
that relies on a pretrained CNN classifier to identify discriminative regions.
Then, foreground and background pixels are sampled from these regions in order
to train a WSOL model for generating activation maps that can accurately
localize objects belonging to a specific class. Empirical results on the
challenging CUB benchmark dataset indicate that our proposed approach can
outperform state-of-art methods over a wide range of threshold values. Our
method provides class activation maps with a better coverage of foreground
object regions w.r.t. the background.
- Abstract(参考訳): 自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
しかし、シーンは様々なオブジェクトを含む複数のマップに分解され、明示的な監視信号は依存しないため、弱い監督対象のローカライゼーション(WSOL)に必要なように、他のオブジェクトと関心の対象を区別することはできない。
この問題に対処するために,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,WSOLモデルをトレーニングするための擬似ラベルを取得することを提案する。
特に,事前訓練されたcnn分類器を用いて識別領域を識別する新しい識別提案サンプリング法が導入された。
そして、これらの領域から前景および背景画素をサンプリングし、特定のクラスに属するオブジェクトを正確にローカライズできるアクティベーションマップを生成するためのWSOLモデルを訓練する。
挑戦的なCUBベンチマークデータセットの実証結果から,提案手法は幅広いしきい値に対して最先端の手法より優れていることが示された。
本手法は,前景オブジェクト領域(背景領域)をよりよく網羅したクラスアクティベーションマップを提供する。
関連論文リスト
- DiPS: Discriminative Pseudo-Label Sampling with Self-Supervised
Transformers for Weakly Supervised Object Localization [13.412674368913747]
識別的擬似ラベルサンプリング(DiPS)は、クラス非依存の写像を弱教師付きオブジェクトの局所化に活用するために導入された。
DiPSは、各アテンションマップの最も識別性の高い領域を特定するために、事前訓練された分類器に依存している。
オブジェクトのさまざまな部分をカバーするために、多様で差別的な提案の豊富なプールを提供する。
論文 参考訳(メタデータ) (2023-10-09T22:52:43Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - MOST: Multiple Object localization with Self-supervised Transformers for
object discovery [97.47075050779085]
自己教師型トランスフォーマー(MOST)を用いた複数オブジェクトのローカライゼーションを提案する。
MOSTは、自己教師付き学習を用いて訓練されたトランスフォーマーの機能を使用して、実世界の画像に複数のオブジェクトをローカライズする。
対象検出器の自己教師付き事前学習にはMOSTが有効であり, 半教師付きオブジェクト検出と非教師付き領域提案生成において一貫した改善が得られた。
論文 参考訳(メタデータ) (2023-04-11T17:57:27Z) - Discriminative Sampling of Proposals in Self-Supervised Transformers for
Weakly Supervised Object Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T18:33:23Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z) - Rethinking the Route Towards Weakly Supervised Object Localization [28.90792512056726]
弱教師付きオブジェクトローカライゼーションは、クラスに依存しないオブジェクトローカライゼーションとオブジェクト分類の2つの部分に分けられるべきである。
クラス非依存のオブジェクトローカライゼーションでは、クラス非依存のメソッドを使用してノイズの多い擬似アノテーションを生成し、クラスラベルなしで境界ボックスのレグレッションを実行する必要がある。
我々のPSOLモデルは、微調整なしで異なるデータセット間で良好な転送性を持つ。
論文 参考訳(メタデータ) (2020-02-26T08:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。