論文の概要: Improving Weakly-supervised Object Localization via Causal Intervention
- arxiv url: http://arxiv.org/abs/2104.10351v1
- Date: Wed, 21 Apr 2021 04:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:26:49.661309
- Title: Improving Weakly-supervised Object Localization via Causal Intervention
- Title(参考訳): 因果干渉による弱教師付き物体定位の改善
- Authors: Feifei Shao, Yawei Luo, Li Zhang, Lu Ye, Siliang Tang, Yi Yang, Jun
Xiao
- Abstract要約: 最近登場したweakly supervised object localization (wsol)メソッドは、画像レベルのラベルのみを使用して、画像内のオブジェクトをローカライズすることを学ぶことができる。
以前の作品では、小さめの判別的注意マップからインターバルオブジェクトを知覚しようと試みているが、共作者は無視している。
提案手法はci-camと呼ばれ,画像,コンテキスト,カテゴリ間の因果関係を探索し,クラスアクティベーションマップにおける共起バイアスを解消する。
- 参考スコア(独自算出の注目度): 41.272141902638275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent emerged weakly supervised object localization (WSOL) methods can
learn to localize an object in the image only using image-level labels.
Previous works endeavor to perceive the interval objects from the small and
sparse discriminative attention map, yet ignoring the co-occurrence confounder
(e.g., bird and sky), which makes the model inspection (e.g., CAM) hard to
distinguish between the object and context. In this paper, we make an early
attempt to tackle this challenge via causal intervention (CI). Our proposed
method, dubbed CI-CAM, explores the causalities among images, contexts, and
categories to eliminate the biased co-occurrence in the class activation maps
thus improving the accuracy of object localization. Extensive experiments on
several benchmarks demonstrate the effectiveness of CI-CAM in learning the
clear object boundaries from confounding contexts. Particularly, in
CUB-200-2011 which severely suffers from the co-occurrence confounder, CI-CAM
significantly outperforms the traditional CAM-based baseline (58.39% vs 52.4%
in top-1 localization accuracy). While in more general scenarios such as
ImageNet, CI-CAM can also perform on par with the state of the arts.
- Abstract(参考訳): 最近登場したweakly supervised object localization(wsol)メソッドは、画像レベルのラベルのみを使用して、画像内のオブジェクトをローカライズすることを学ぶことができる。
それまでの作業では、間隔オブジェクトを小さめの差別的注意マップから知覚しようと努力したが、共起共同創設者(鳥と空など)を無視し、モデル検査(例えばCAM)がオブジェクトとコンテキストを区別することを困難にしている。
本稿では,この課題を因果介入(CI)によって早期に解決しようと試みる。
提案手法はCI-CAMと呼ばれ,画像,コンテキスト,カテゴリ間の因果関係を探索し,クラスアクティベーションマップの偏りを排除し,オブジェクトの局所化の精度を向上させる。
いくつかのベンチマークにおいて、CI-CAMがコンテキスト境界から明確なオブジェクト境界を学習する際の有効性を示す大規模な実験が行われた。
特に共同設立者のCUB-200-2011では、CI-CAMは従来のCAMベースのベースライン(トップ1のローカライゼーション精度では58.39%対52.4%)を著しく上回っている。
ImageNetのような一般的なシナリオでは、CI-CAMはアーティファクトの状況と同等に実行できる。
関連論文リスト
- HEAP: Unsupervised Object Discovery and Localization with Contrastive
Grouping [29.678756772610797]
教師なしオブジェクトの発見と位置決めは、監督なしで画像内のオブジェクトを検出し、セグメント化することを目的としている。
近年の取り組みは、自己監督型トランスフォーマー機能を利用して、有能な前景物体を識別する顕著な可能性を実証している。
これらの問題に対処するために、Herarchical mErging framework via contrAstive grouPing (HEAP) を紹介する。
論文 参考訳(メタデータ) (2023-12-29T06:46:37Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - A Closer Look at the Explainability of Contrastive Language-Image Pre-training [16.10032166963232]
Contrastive Language-image Pre-training (CLIP)は、様々なタスクに対して大きなメリットを示す強力なビジョン言語モデルである。
我々は,その信頼性を損なうような説明可能性の問題と,関連するタスクのキャパシティの制限を指摘した。
本稿では,CLIP surgery for reliable CAMを提案する。
論文 参考訳(メタデータ) (2023-04-12T07:16:55Z) - Knowledge-guided Causal Intervention for Weakly-supervised Object
Localization [32.99508048913356]
KG-CI-CAMは知識誘導因果介入法である。
我々は、因果介入による共起コンテキスト共同設立問題に取り組む。
分類知識の吸収と局所化知識のバランスをとるための多元的知識指導フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-03T12:02:19Z) - Zero-Shot Temporal Action Detection via Vision-Language Prompting [134.26292288193298]
視覚言語プロンプト(STALE)を用いた新しいゼロショット時間行動検出モデルを提案する。
我々のモデルは最先端の代替品を著しく上回っている。
我々のモデルは、近年の強力な競合相手よりも監督的TADにおいて優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-07-17T13:59:46Z) - Anti-Adversarially Manipulated Attributions for Weakly Supervised
Semantic Segmentation and Object Localization [31.69344455448125]
本稿では,最終ソフトマックス層やシグモイド層の前に分類器が生成する分類スコアを増やすために操作した画像の属性マップを提案する。
この操作は対逆的な方法で実現され、元の画像は対逆攻撃で使用されるものと反対方向に画素勾配に沿って摂動される。
さらに,対象物に関係のない領域の不正な帰属と,対象物の小さな領域への過剰な帰属の集中を抑制する新たな正規化手法を導入する。
論文 参考訳(メタデータ) (2022-04-11T06:18:02Z) - Bridging the Gap between Classification and Localization for Weakly
Supervised Object Localization [39.63778214094173]
弱教師付きオブジェクトローカライゼーションは、画像レベルラベルのような弱い監督しか持たない対象領域を所定の画像内に見つけることを目的としている。
入力特徴とクラス固有の重みの方向のずれから,分類と局所化のギャップを見いだす。
本稿では,特徴方向をクラス固有の重みに整合させてギャップを埋める手法を提案する。
論文 参考訳(メタデータ) (2022-04-01T05:49:22Z) - TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised
Object Localization [112.46381729542658]
弱監督オブジェクトローカリゼーション(WSOL)は、画像カテゴリラベルを与えられたときに難しい問題です。
長距離依存抽出のための視覚変換器における自己注意機構をフル活用するために,トークン意味結合注意マップ(TS-CAM)を導入する。
論文 参考訳(メタデータ) (2021-03-27T09:43:16Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。