論文の概要: Hierarchical Complementary Learning for Weakly Supervised Object
Localization
- arxiv url: http://arxiv.org/abs/2011.08014v1
- Date: Mon, 16 Nov 2020 14:58:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 00:32:43.403480
- Title: Hierarchical Complementary Learning for Weakly Supervised Object
Localization
- Title(参考訳): 弱教師付き物体定位のための階層的補完学習
- Authors: Sabrina Narimene Benassou, Wuzhen Shi, Feng Jiang, Abdallah Benzine
- Abstract要約: 弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルだけでオブジェクトをローカライズすることを目的とした課題である。
本稿では,CNNが画像上のオブジェクトのより優れた分類とローカライズを行うのに役立つ階層型補完学習ネットワーク(HCLNet)を提案する。
- 参考スコア(独自算出の注目度): 12.104019927107517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised object localization (WSOL) is a challenging problem which
aims to localize objects with only image-level labels. Due to the lack of
ground truth bounding boxes, class labels are mainly employed to train the
model. This model generates a class activation map (CAM) which activates the
most discriminate features. However, the main drawback of CAM is the ability to
detect just a part of the object. To solve this problem, some researchers have
removed parts from the detected object \cite{b1, b2, b4}, or the image
\cite{b3}. The aim of removing parts from image or detected parts of the object
is to force the model to detect the other features. However, these methods
require one or many hyper-parameters to erase the appropriate pixels on the
image, which could involve a loss of information. In contrast, this paper
proposes a Hierarchical Complementary Learning Network method (HCLNet) that
helps the CNN to perform better classification and localization of objects on
the images. HCLNet uses a complementary map to force the network to detect the
other parts of the object. Unlike previous works, this method does not need any
extras hyper-parameters to generate different CAMs, as well as does not
introduce a big loss of information. In order to fuse these different maps, two
different fusion strategies known as the addition strategy and the l1-norm
strategy have been used. These strategies allowed to detect the whole object
while excluding the background. Extensive experiments show that HCLNet obtains
better performance than state-of-the-art methods.
- Abstract(参考訳): 弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルだけでオブジェクトをローカライズすることを目的とした課題である。
基底的真理のバウンディングボックスが欠如しているため、クラスラベルは主にモデルのトレーニングに使用されている。
このモデルは、最も差別化された特徴を活性化するクラスアクティベーションマップ(CAM)を生成する。
しかし、CAMの主な欠点は、オブジェクトの一部だけを検出する能力である。
この問題を解決するために、検出された対象 \cite{b1, b2, b4} または画像 \cite{b3} から部分を取り除く研究者もいる。
オブジェクトのイメージや検出された部分から部品を取り除く目的は、モデルに他の特徴を検出するように強制することである。
しかし、これらの方法は画像上の適切なピクセルを消去するために1つ以上のハイパーパラメータを必要とする。
これとは対照的に,CNNが画像上のオブジェクトのより優れた分類とローカライズを行うのに役立つ階層型補完学習ネットワーク(HCLNet)を提案する。
HCLNetは補足マップを使用して、ネットワークにオブジェクトの他の部分を検出するように強制する。
従来の手法とは異なり、この手法では異なるCAMを生成するために余分なハイパーパラメータは必要ない。
これらの異なるマップを融合させるために、加法戦略とl1-ノルム戦略という2つの異なる融合戦略が用いられてきた。
これらの戦略により、背景を除外しながらオブジェクト全体を検出できる。
広範な実験により、hclnetは最先端のメソッドよりも優れた性能を得ることが示された。
関連論文リスト
- PDiscoNet: Semantically consistent part discovery for fine-grained
recognition [62.12602920807109]
画像レベルのクラスラベルのみを用いて,対象部品の発見を推奨する先行情報とともにPDiscoNetを提案する。
CUB,CelebA,PartImageNet で得られた結果から,提案手法は従来手法よりもかなり優れた部分発見性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-09-06T17:19:29Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Image Segmentation-based Unsupervised Multiple Objects Discovery [1.7674345486888503]
教師なしオブジェクト発見は、イメージ内のオブジェクトをローカライズすることを目的としている。
我々は,複数のオブジェクトの発見に対して,完全に教師なしのボトムアップアプローチを提案する。
我々は、教師なしクラス非依存オブジェクト検出と教師なしイメージセグメンテーションの両方に対して、最先端の結果を提供する。
論文 参考訳(メタデータ) (2022-12-20T09:48:24Z) - Contrastive learning of Class-agnostic Activation Map for Weakly
Supervised Object Localization and Semantic Segmentation [32.76127086403596]
ラベルなし画像データを用いたクラス非依存型活性化マップ(C$2$AM)生成のためのコントラスト学習を提案する。
我々は上記の関係に基づいて正対と負の対を形成し、ネットワークを前景と背景を乱すように強制する。
ネットワークは画像前景を識別するために誘導されるため,本手法で学習したクラス非依存のアクティベーションマップは,より完全なオブジェクト領域を生成する。
論文 参考訳(メタデータ) (2022-03-25T08:46:24Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z) - Addressing Visual Search in Open and Closed Set Settings [8.928169373673777]
低解像度ギスト画像から画素レベルのオブジェクト性を予測する手法を提案する。
次に,高分解能で局所的にオブジェクト検出を行う領域を選択する。
第二に、未確認の可能性のある対象クラスの全てのインスタンスを探索するオープンセットビジュアルサーチの新しい手法を提案する。
論文 参考訳(メタデータ) (2020-12-11T17:21:28Z) - Entropy Guided Adversarial Model for Weakly Supervised Object
Localization [11.77745060973134]
トレーニング中にネットワークが生成したCAMにシャノンエントロピーを適用して誘導する。
我々の手法は、画像のどの部分も消去しないし、ネットワークのアーカイトキュアも変更しない。
我々のEntropy Guided Adversarial Model(EGAモデル)は、ローカライゼーションと分類精度の両面において、最先端のアーツベンチマークの性能を改善した。
論文 参考訳(メタデータ) (2020-08-04T19:39:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。