Fugu-MT 論文翻訳(概要): Further Improving Weakly-supervised Object Localization via Causal Knowledge Distillation

論文の概要: Further Improving Weakly-supervised Object Localization via Causal Knowledge Distillation

arxiv url: http://arxiv.org/abs/2301.01060v1
Date: Tue, 3 Jan 2023 12:02:19 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-04 14:40:27.373431
Title: Further Improving Weakly-supervised Object Localization via Causal Knowledge Distillation
Title（参考訳）: 因果知識蒸留による弱教師付き物体定位の改善
Authors: Feifei Shao, Yawei Luo, Shengjian Wu, Qiyi Li, Fei Gao, Yi Yang, Jun Xiao
Abstract要約: 弱教師付きオブジェクトローカライゼーションは、画像レベルラベルのみを付与された画像内のオブジェクトのカテゴリとスコープを示すことを目的としている。既存の作業の多くは、クラスアクティベーションマッピング(CAM)に基づいており、アクティベーションマップ内の識別領域を拡大して、オブジェクト全体を知覚する努力をしている。 KD-CI-CAMと呼ばれるカジュアルな知識蒸留手法を提案する。
参考スコア（独自算出の注目度）: 33.329852987440574
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Weakly-supervised object localization aims to indicate the category as well as the scope of an object in an image given only the image-level labels. Most of the existing works are based on Class Activation Mapping (CAM) and endeavor to enlarge the discriminative area inside the activation map to perceive the whole object, yet ignore the co-occurrence confounder of the object and context (e.g., fish and water), which makes the model inspection hard to distinguish object boundaries. Besides, the use of CAM also brings a dilemma problem that the classification and localization always suffer from a performance gap and can not reach their highest accuracy simultaneously. In this paper, we propose a casual knowledge distillation method, dubbed KD-CI-CAM, to address these two under-explored issues in one go. More specifically, we tackle the co-occurrence context confounder problem via causal intervention (CI), which explores the causalities among image features, contexts, and categories to eliminate the biased object-context entanglement in the class activation maps. Based on the de-biased object feature, we additionally propose a multi-teacher causal distillation framework to balance the absorption of classification knowledge and localization knowledge during model training. Extensive experiments on several benchmarks demonstrate the effectiveness of KD-CI-CAM in learning clear object boundaries from confounding contexts and addressing the dilemma problem between classification and localization performance.
Abstract（参考訳）: 弱教師付きオブジェクトローカライゼーションは、画像レベルラベルのみを付与した画像内のオブジェクトのカテゴリとスコープを示すことを目的としている。既存の作品のほとんどは、クラスアクティベーションマッピング(cam)に基づいており、アクティベーションマップ内の識別領域を拡大してオブジェクト全体を認識しようとしているが、オブジェクトとコンテキスト(例えば魚と水)の共起者を無視しているため、モデルの検査はオブジェクトの境界を区別することが困難である。さらに、CAMを使用すると、分類とローカライゼーションが常にパフォーマンスギャップに悩まされ、同時に最高の精度に達することができないというジレンマ問題も生じる。本稿では,この2つの未解決問題に対処するために,kd-ci-camと呼ばれるカジュアルな知識蒸留法を提案する。より具体的には、画像特徴、コンテキスト、カテゴリ間の因果関係を探索し、クラスアクティベーションマップにおける偏りのあるオブジェクト-コンテキストの絡みを取り除く、因果介入(CI)による共起コンテキスト共創問題に取り組む。さらに,脱バイアスオブジェクトの特徴に基づいて,モデルの学習中に分類知識の吸収と局所化知識のバランスをとるマルチティーチャー因果蒸留フレームワークを提案する。 KD-CI-CAMは,コンテキストの相違から明確な対象境界を学習し,分類とローカライゼーション性能のジレンマ問題に対処する上で有効であることを示す。

関連論文リスト

Generative Human-Object Interaction Detection via Differentiable Cognitive Steering of Multi-modal LLMs [85.69785384599827]
人間と物体の相互作用(Human-object Interaction、HOI)の検出は、人と物体のペアとそれらの相互作用を局在させることを目的としている。既存のメソッドはクローズドワールドの仮定の下で動作し、タスクを未定義の小さな動詞集合上の分類問題として扱う。本稿では,閉集合分類タスクから開語彙生成問題へのHOI検出を再構成する新しい生成推論・ステアブル知覚フレームワークGRASP-HOを提案する。
論文参考訳（メタデータ） (2025-12-19T14:41:50Z)
Knowledge Transfer with Simulated Inter-Image Erasing for Weakly Supervised Semantic Segmentation [28.233690786378393]
弱教師付きセマンティックセグメンテーションのためのtextbfKnowledge textbfTransfer with textbfSimulated Inter-Image textbfErasing (KTSE) アプローチを提案する。
論文参考訳（メタデータ） (2024-07-03T02:54:33Z)
Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-01T17:32:26Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
Learning Prompt-Enhanced Context Features for Weakly-Supervised Video Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文参考訳（メタデータ） (2023-06-26T06:45:16Z)
Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文参考訳（メタデータ） (2023-05-12T00:13:17Z)
Reason from Context with Self-supervised Learning [15.16197896174348]
文脈推論(SeCo)のための外部記憶を用いた自己教師型手法を提案する。どちらのタスクでも、SeCoはすべての最先端(SOTA)SSLメソッドを大幅なマージンで上回りました。以上の結果から,SeCoは人間的な行動を示すことが明らかとなった。
論文参考訳（メタデータ） (2022-11-23T10:02:05Z)
Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文参考訳（メタデータ） (2021-12-21T17:10:21Z)
Weakly-Supervised Video Object Grounding via Causal Intervention [82.68192973503119]
我々は、モデル学習中にのみビデオ文アノテーションが利用できる、弱教師付きビデオオブジェクトグラウンドディング(WSVOG)の課題をターゲットにしている。文で記述されたオブジェクトをビデオの視覚領域にローカライズすることを目的としており、パターン分析や機械学習に必要な基本的な機能である。
論文参考訳（メタデータ） (2021-12-01T13:13:03Z)
Improving Weakly-supervised Object Localization via Causal Intervention [41.272141902638275]
最近登場したweakly supervised object localization (wsol)メソッドは、画像レベルのラベルのみを使用して、画像内のオブジェクトをローカライズすることを学ぶことができる。以前の作品では、小さめの判別的注意マップからインターバルオブジェクトを知覚しようと試みているが、共作者は無視している。提案手法はci-camと呼ばれ,画像,コンテキスト,カテゴリ間の因果関係を探索し,クラスアクティベーションマップにおける共起バイアスを解消する。
論文参考訳（メタデータ） (2021-04-21T04:44:33Z)
Unveiling the Potential of Structure-Preserving for Weakly Supervised Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文参考訳（メタデータ） (2021-03-08T03:04:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。