論文の概要: Entropy Guided Adversarial Model for Weakly Supervised Object
Localization
- arxiv url: http://arxiv.org/abs/2008.01786v1
- Date: Tue, 4 Aug 2020 19:39:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 00:52:06.408327
- Title: Entropy Guided Adversarial Model for Weakly Supervised Object
Localization
- Title(参考訳): 弱教師付き物体定位のためのエントロピー誘導逆モデル
- Authors: Sabrina Narimene Benassou, Wuzhen Shi, Feng Jiang
- Abstract要約: トレーニング中にネットワークが生成したCAMにシャノンエントロピーを適用して誘導する。
我々の手法は、画像のどの部分も消去しないし、ネットワークのアーカイトキュアも変更しない。
我々のEntropy Guided Adversarial Model(EGAモデル)は、ローカライゼーションと分類精度の両面において、最先端のアーツベンチマークの性能を改善した。
- 参考スコア(独自算出の注目度): 11.77745060973134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Object Localization is challenging because of the lack of
bounding box annotations. Previous works tend to generate a class activation
map i.e CAM to localize the object. Unfortunately, the network activates only
the features that discriminate the object and does not activate the whole
object. Some methods tend to remove some parts of the object to force the CNN
to detect other features, whereas, others change the network structure to
generate multiple CAMs from different levels of the model. In this present
article, we propose to take advantage of the generalization ability of the
network and train the model using clean examples and adversarial examples to
localize the whole object. Adversarial examples are typically used to train
robust models and are images where a perturbation is added. To get a good
classification accuracy, the CNN trained with adversarial examples is forced to
detect more features that discriminate the object. We futher propose to apply
the shannon entropy on the CAMs generated by the network to guide it during
training. Our method does not erase any part of the image neither does it
change the network architecure and extensive experiments show that our Entropy
Guided Adversarial model (EGA model) improved performance on state of the arts
benchmarks for both localization and classification accuracy.
- Abstract(参考訳): 境界ボックスアノテーションがないため、弱い教師付きオブジェクトローカライゼーションは困難である。
以前の作業では、オブジェクトをローカライズするためにクラスアクティベーションマップ、すなわちCAMを生成する傾向がある。
残念ながら、ネットワークはオブジェクトを識別する機能のみを起動し、オブジェクト全体をアクティベートしない。
あるメソッドは、CNNが他の特徴を検出するためにオブジェクトの一部を取り除く傾向があり、他のメソッドは、モデルの異なるレベルから複数のCAMを生成するためにネットワーク構造を変更する。
本稿では,ネットワークの一般化能力を生かして,クリーンな例と逆例を用いてモデルを学習し,オブジェクト全体をローカライズする手法を提案する。
逆向きの例は通常、頑健なモデルを訓練するために使われ、摂動が加えられた画像である。
適切な分類精度を得るために、逆の例で訓練されたcnnは、オブジェクトを識別するより多くの特徴を検出せざるを得ない。
我々は、トレーニング中にネットワークが生成したCAMにシャノンエントロピーを適用して誘導することを提案する。
提案手法は画像のどの部分も消去しないが,ネットワークのアーカイブを変更することはなく,広範な実験により,エントロピー誘導アドバーサリアンモデル(egaモデル)により,画像のローカライズと分類の精度が向上した。
関連論文リスト
- Robust Change Detection Based on Neural Descriptor Fields [53.111397800478294]
我々は、部分的に重なり合う観測結果とノイズのある局所化結果に頑健なオブジェクトレベルのオンライン変化検出手法を開発した。
形状符号の類似性を利用して物体を連想させ, 局所的な物体近傍の空間配置を比較することにより, 観測重複や局所雑音に対する頑健性を示す。
論文 参考訳(メタデータ) (2022-08-01T17:45:36Z) - Experience feedback using Representation Learning for Few-Shot Object
Detection on Aerial Images [2.8560476609689185]
大規模なリモートセンシング画像データセットであるDOTAを用いて,本手法の性能評価を行った。
特に、数発のオブジェクト検出タスクの固有の弱点を強調します。
論文 参考訳(メタデータ) (2021-09-27T13:04:53Z) - Object-aware Contrastive Learning for Debiased Scene Representation [74.30741492814327]
オブジェクトを自己教師型でローカライズする,オブジェクト認識型コントラスト学習フレームワークを開発した。
また、コントラCAM、オブジェクト認識型乱作、背景混合に基づく2つのデータ拡張を導入し、コントラスト型自己教師型学習における文脈バイアスと背景バイアスを低減した。
論文 参考訳(メタデータ) (2021-07-30T19:24:07Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Hierarchical Complementary Learning for Weakly Supervised Object
Localization [12.104019927107517]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルだけでオブジェクトをローカライズすることを目的とした課題である。
本稿では,CNNが画像上のオブジェクトのより優れた分類とローカライズを行うのに役立つ階層型補完学習ネットワーク(HCLNet)を提案する。
論文 参考訳(メタデータ) (2020-11-16T14:58:51Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z) - Eigen-CAM: Class Activation Map using Principal Components [1.2691047660244335]
この論文は、解釈可能で堅牢で透明なモデルに対する需要の増加に対応するために、従来の考え方に基づいている。
提案したEigen-CAMは、畳み込み層から学習した特徴/表現の基本的なコンポーネントを計算し、視覚化する。
論文 参考訳(メタデータ) (2020-08-01T17:14:13Z) - Synthesizing Unrestricted False Positive Adversarial Objects Using
Generative Models [0.0]
逆の例は、ニューラルネットワークによって誤って分類されたデータポイントである。
最近の研究は、制限のない敵の例の概念を導入した。
対象検出の非制限逆例を生成する新たな攻撃カテゴリを提案する。
論文 参考訳(メタデータ) (2020-05-19T08:58:58Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。