論文の概要: Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization
- arxiv url: http://arxiv.org/abs/2103.04523v1
- Date: Mon, 8 Mar 2021 03:04:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 22:41:58.269932
- Title: Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization
- Title(参考訳): 弱教師付き物体定位における構造保存の可能性
- Authors: Xingjia Pan, Yingguo Gao, Zhiwen Lin, Fan Tang, Weiming Dong, Haolei
Yuan, Feiyue Huang, Changsheng Xu
- Abstract要約: 本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
- 参考スコア(独自算出の注目度): 71.79436685992128
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly supervised object localization remains an open problem due to the
deficiency of finding object extent information using a classification network.
While prior works struggle to localize objects by various spatial
regularization strategies, we argue that how to extract object structural
information from the trained classification network is neglected. In this
paper, we propose a two-stage approach, termed structure-preserving activation
(SPA), towards fully leveraging the structure information incorporated in
convolutional features for WSOL. In the first stage, a restricted activation
module (RAM) is designed to alleviate the structure-missing issue caused by the
classification network, based on the observation that the unbounded
classification map and global average pooling layer drive the network to focus
only on object parts. In the second stage, we propose a post-process approach,
termed self-correlation map generating (SCG) module to obtain
structure-preserving localization maps on the basis of the activation maps
acquired from the first stage. Specifically, we utilize the high-order
self-correlation (HSC) to extract the inherent structural information retained
in the learned model and then aggregate HSC of multiple points for precise
object localization. Extensive experiments on two publicly available benchmarks
including CUB-200-2011 and ILSVRC show that the proposed SPA achieves
substantial and consistent performance gains compared with baseline approaches.
- Abstract(参考訳): 分類ネットワークを用いた対象範囲情報の発見が不足しているため,弱い教師付き対象の局所化は未解決の問題である。
先行研究は様々な空間正規化戦略によるオブジェクトのローカライズに苦慮する一方で、訓練された分類ネットワークからオブジェクト構造情報を抽出する方法は無視されていると論じている。
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、制約付きアクティベーションモジュール(ram)が、未境界分類マップとグローバル平均プーリング層がネットワークを対象部品のみに集中させるという観測に基づいて、分類ネットワークによって引き起こされる構造ミス問題を軽減するように設計されている。
第2段階では,第1段階から獲得したアクティベーションマップに基づいて,構造保存型ローカリゼーションマップを得るためのプロセス後アプローチである自己相関マップ生成(SCG)モジュールを提案する。
具体的には,高次自己相関(high-order self-correlation, hsc)を用いて,学習モデルに保持されている固有構造情報を抽出する。
CUB-200-2011 と ILSVRC を含む2つの公開ベンチマークの大規模な実験により、提案したSPA はベースラインアプローチと比較して大幅に、一貫した性能向上を達成した。
関連論文リスト
- Localization and Expansion: A Decoupled Framework for Point Cloud Few-shot Semantic Segmentation [39.7657197805346]
Point Cloud few-shot semantic segmentation (PC-FSS)は、特定のクエリポイントクラウドに、いくつかのアノテーション付きのサポートサンプルで、新しいカテゴリのターゲットをセグメントすることを目的としている。
本稿では,DLE(Decoupled Localization and Expansion)の精神における,シンプルで効果的な枠組みを提案する。
構造的ローカライゼーションモジュール(SLM)と自己拡張モジュール(SEM)を含むDLEは、いくつかのメリットを享受している。
論文 参考訳(メタデータ) (2024-08-25T07:34:32Z) - Spatial Structure Constraints for Weakly Supervised Semantic
Segmentation [100.0316479167605]
クラスアクティベーションマップ(CAM)は、オブジェクトの最も識別性の高い部分のみを見つけることができる。
注意伸縮の余剰なオブジェクトの過剰な活性化を軽減するために,弱い教師付きセマンティックセマンティックセグメンテーションのための空間構造制約(SSC)を提案する。
提案手法は,PASCAL VOC 2012とCOCOデータセットでそれぞれ72.7%,47.0%mIoUを達成した。
論文 参考訳(メタデータ) (2024-01-20T05:25:25Z) - Weakly Supervised Open-Vocabulary Object Detection [31.605276665964787]
本稿では、従来のWSODを拡張するために、弱教師付きオープン語彙オブジェクト検出フレームワーク、すなわちWSOVODを提案する。
これを実現するために、データセットレベルの特徴適応、画像レベルの有意なオブジェクトローカライゼーション、地域レベルの視覚言語アライメントを含む3つの重要な戦略を検討する。
論文 参考訳(メタデータ) (2023-12-19T18:59:53Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。