論文の概要: Knowledge-guided Causal Intervention for Weakly-supervised Object
Localization
- arxiv url: http://arxiv.org/abs/2301.01060v2
- Date: Tue, 12 Mar 2024 06:55:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 02:38:15.807069
- Title: Knowledge-guided Causal Intervention for Weakly-supervised Object
Localization
- Title(参考訳): 弱教師付き物体定位に対する知識誘導因果介入
- Authors: Feifei Shao, Yawei Luo, Fei Gao, Yi Yang, Jun Xiao
- Abstract要約: KG-CI-CAMは知識誘導因果介入法である。
我々は、因果介入による共起コンテキスト共同設立問題に取り組む。
分類知識の吸収と局所化知識のバランスをとるための多元的知識指導フレームワークを提案する。
- 参考スコア(独自算出の注目度): 32.99508048913356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous weakly-supervised object localization (WSOL) methods aim to expand
activation map discriminative areas to cover the whole objects, yet neglect two
inherent challenges when relying solely on image-level labels. First, the
``entangled context'' issue arises from object-context co-occurrence (\eg, fish
and water), making the model inspection hard to distinguish object boundaries
clearly. Second, the ``C-L dilemma'' issue results from the information decay
caused by the pooling layers, which struggle to retain both the semantic
information for precise classification and those essential details for accurate
localization, leading to a trade-off in performance. In this paper, we propose
a knowledge-guided causal intervention method, dubbed KG-CI-CAM, to address
these two under-explored issues in one go. More specifically, we tackle the
co-occurrence context confounder problem via causal intervention, which
explores the causalities among image features, contexts, and categories to
eliminate the biased object-context entanglement in the class activation maps.
Based on the disentangled object feature, we introduce a multi-source knowledge
guidance framework to strike a balance between absorbing classification
knowledge and localization knowledge during model training. Extensive
experiments conducted on several benchmark datasets demonstrate the
effectiveness of KG-CI-CAM in learning distinct object boundaries amidst
confounding contexts and mitigating the dilemma between classification and
localization performance.
- Abstract(参考訳): 従来のwsol(weakly supervised object localization)法は、アクティベーションマップの識別領域を拡張してオブジェクト全体をカバーすることを目的としているが、画像レベルのラベルのみに依存する場合の2つの固有の課題を無視する。
まず、`enangled context' という問題は、オブジェクトコンテキストの共起 (\eg, fish and water) から生じ、モデル検査がオブジェクト境界を明確に区別することが困難になる。
第二に、「C-Lジレンマ」は、正確な分類のための意味情報と正確な局所化のための重要な情報の両方を保持するのに苦労するプール層によって引き起こされる情報減衰から生じる。
本稿では,この2つの未解決問題に対処するために,kg-ci-camと呼ばれる知識誘導因果介入法を提案する。
具体的には、画像の特徴、コンテキスト、カテゴリ間の因果関係を探索し、クラスアクティベーションマップにおける偏りのあるオブジェクト-コンテキストの絡みを除去する因果介入による共起コンテキスト共創問題に取り組む。
この不整合オブジェクトの特徴に基づいて,モデルの学習中に,分類知識の吸収と局所化知識のバランスをとるための多元的知識指導フレームワークを導入する。
いくつかのベンチマークデータセットで行った広範囲な実験は、異なるオブジェクト境界の学習におけるkg-ci-camの有効性を実証し、分類とローカライズ性能のジレンマを緩和する。
関連論文リスト
- Knowledge Transfer with Simulated Inter-Image Erasing for Weakly Supervised Semantic Segmentation [28.233690786378393]
弱教師付きセマンティックセグメンテーションのためのtextbfKnowledge textbfTransfer with textbfSimulated Inter-Image textbfErasing (KTSE) アプローチを提案する。
論文 参考訳(メタデータ) (2024-07-03T02:54:33Z) - Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。
近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。
本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-01T17:32:26Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Reason from Context with Self-supervised Learning [15.16197896174348]
文脈推論(SeCo)のための外部記憶を用いた自己教師型手法を提案する。
どちらのタスクでも、SeCoはすべての最先端(SOTA)SSLメソッドを大幅なマージンで上回りました。
以上の結果から,SeCoは人間的な行動を示すことが明らかとなった。
論文 参考訳(メタデータ) (2022-11-23T10:02:05Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Weakly-Supervised Video Object Grounding via Causal Intervention [82.68192973503119]
我々は、モデル学習中にのみビデオ文アノテーションが利用できる、弱教師付きビデオオブジェクトグラウンドディング(WSVOG)の課題をターゲットにしている。
文で記述されたオブジェクトをビデオの視覚領域にローカライズすることを目的としており、パターン分析や機械学習に必要な基本的な機能である。
論文 参考訳(メタデータ) (2021-12-01T13:13:03Z) - Improving Weakly-supervised Object Localization via Causal Intervention [41.272141902638275]
最近登場したweakly supervised object localization (wsol)メソッドは、画像レベルのラベルのみを使用して、画像内のオブジェクトをローカライズすることを学ぶことができる。
以前の作品では、小さめの判別的注意マップからインターバルオブジェクトを知覚しようと試みているが、共作者は無視している。
提案手法はci-camと呼ばれ,画像,コンテキスト,カテゴリ間の因果関係を探索し,クラスアクティベーションマップにおける共起バイアスを解消する。
論文 参考訳(メタデータ) (2021-04-21T04:44:33Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。