論文の概要: Rethinking the Route Towards Weakly Supervised Object Localization
- arxiv url: http://arxiv.org/abs/2002.11359v2
- Date: Tue, 3 Mar 2020 03:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 15:08:43.844371
- Title: Rethinking the Route Towards Weakly Supervised Object Localization
- Title(参考訳): 弱教師付き物体定位への道の再考
- Authors: Chen-Lin Zhang, Yun-Hao Cao, Jianxin Wu
- Abstract要約: 弱教師付きオブジェクトローカライゼーションは、クラスに依存しないオブジェクトローカライゼーションとオブジェクト分類の2つの部分に分けられるべきである。
クラス非依存のオブジェクトローカライゼーションでは、クラス非依存のメソッドを使用してノイズの多い擬似アノテーションを生成し、クラスラベルなしで境界ボックスのレグレッションを実行する必要がある。
我々のPSOLモデルは、微調整なしで異なるデータセット間で良好な転送性を持つ。
- 参考スコア(独自算出の注目度): 28.90792512056726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised object localization (WSOL) aims to localize objects with
only image-level labels. Previous methods often try to utilize feature maps and
classification weights to localize objects using image level annotations
indirectly. In this paper, we demonstrate that weakly supervised object
localization should be divided into two parts: class-agnostic object
localization and object classification. For class-agnostic object localization,
we should use class-agnostic methods to generate noisy pseudo annotations and
then perform bounding box regression on them without class labels. We propose
the pseudo supervised object localization (PSOL) method as a new way to solve
WSOL. Our PSOL models have good transferability across different datasets
without fine-tuning. With generated pseudo bounding boxes, we achieve 58.00%
localization accuracy on ImageNet and 74.97% localization accuracy on CUB-200,
which have a large edge over previous models.
- Abstract(参考訳): weakly supervised object localization (wsol) は、画像レベルのラベルだけでオブジェクトをローカライズすることを目的としている。
従来の手法では、画像レベルのアノテーションを使ってオブジェクトを間接的にローカライズするために、特徴マップと分類重みを利用する場合が多い。
本稿では,弱教師付きオブジェクトローカライゼーションをクラス非依存オブジェクトローカライゼーションとオブジェクト分類の2つの部分に分けるべきであることを示す。
クラスに依存しないオブジェクトローカライゼーションでは、クラスに依存しないメソッドを使ってノイズの多い擬似アノテーションを生成し、クラスラベルなしでバウンディングボックスレグレッションを実行すべきです。
疑似教師付きオブジェクトローカライゼーション(PSOL)法をWSOLの新たな解決法として提案する。
我々のPSOLモデルは、微調整なしで異なるデータセット間で良好な転送性を持つ。
生成した擬似バウンディングボックスでは、ImageNet上で58.00%のローカライズ精度、CUB-200上で74.97%のローカライズ精度を実現している。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。
実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-03-18T15:38:17Z) - Constrained Sampling for Class-Agnostic Weakly Supervised Object
Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T19:58:38Z) - Discriminative Sampling of Proposals in Self-Supervised Transformers for
Weakly Supervised Object Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T18:33:23Z) - ViTOL: Vision Transformer for Weakly Supervised Object Localization [0.735996217853436]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのカテゴリラベルのみを用いて、画像内のオブジェクト位置を予測することを目的としている。
画像分類モデルがローカライズ対象の場合に遭遇する一般的な課題は、(a) ローカライズマップを非常に小さな領域に限定する画像において最も識別性の高い特徴を見る傾向にあり、(b) ローカライズマップはクラス非依存であり、モデルは同一画像内の複数のクラスのオブジェクトをハイライトする。
論文 参考訳(メタデータ) (2022-04-14T06:16:34Z) - Bridging the Gap between Classification and Localization for Weakly
Supervised Object Localization [39.63778214094173]
弱教師付きオブジェクトローカライゼーションは、画像レベルラベルのような弱い監督しか持たない対象領域を所定の画像内に見つけることを目的としている。
入力特徴とクラス固有の重みの方向のずれから,分類と局所化のギャップを見いだす。
本稿では,特徴方向をクラス固有の重みに整合させてギャップを埋める手法を提案する。
論文 参考訳(メタデータ) (2022-04-01T05:49:22Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。