論文の概要: Mitigating Biased Activation in Weakly-supervised Object Localization
via Counterfactual Learning
- arxiv url: http://arxiv.org/abs/2305.15354v1
- Date: Wed, 24 May 2023 17:07:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 14:01:44.317485
- Title: Mitigating Biased Activation in Weakly-supervised Object Localization
via Counterfactual Learning
- Title(参考訳): 反事実学習による弱教師付き物体定位におけるバイアスド・アクティベーションの軽減
- Authors: Feifei Shao, Yawei Luo, Lei Chen, Ping Liu, Yi Yang, Jun Xiao
- Abstract要約: 本稿では,従来の弱教師付オブジェクトローカライゼーション手法におけるバイアス付アクティベーションの未検討問題に焦点をあてる。
本稿では, 対実表現を合成するために, 対実共起学習パラダイムを提案する。
いくつかのベンチマークの実験では、反現実的CAMは偏りのあるアクティベーション問題を緩和することに成功した。
- 参考スコア(独自算出の注目度): 42.14262703888554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we focus on an under-explored issue of biased activation in
prior weakly-supervised object localization methods based on Class Activation
Mapping (CAM). We analyze the cause of this problem from a causal view and
attribute it to the co-occurring background confounders. Following this
insight, we propose a novel Counterfactual Co-occurring Learning (CCL) paradigm
to synthesize the counterfactual representations via coupling constant
foreground and unrealized backgrounds in order to cut off their co-occurring
relationship. Specifically, we design a new network structure called
Counterfactual-CAM, which embeds the counterfactual representation perturbation
mechanism into the vanilla CAM-based model. This mechanism is responsible for
decoupling foreground as well as background and synthesizing the counterfactual
representations. By training the detection model with these synthesized
representations, we compel the model to focus on the constant foreground
content while minimizing the influence of distracting co-occurring background.
To our best knowledge, it is the first attempt in this direction. Extensive
experiments on several benchmarks demonstrate that Counterfactual-CAM
successfully mitigates the biased activation problem, achieving improved object
localization accuracy.
- Abstract(参考訳): 本稿では,クラスアクティベーションマッピング(CAM)に基づく事前の弱教師付きオブジェクトローカライゼーション手法において,バイアス付アクティベーションの未解決問題に焦点をあてる。
我々は,この問題の原因を因果的観点から分析し,その背景を共同設立者とする。
そこで本研究では,共起関係を抑えるために,前景と非現実的背景を結合することで,対物表現を合成する,対物共起学習(CCL)パラダイムを提案する。
具体的には,対物表現摂動機構をバニラカムモデルに組み込んだ対物表現camと呼ばれる新しいネットワーク構造を設計する。
このメカニズムは前景と背景を分離し、反事実表現を合成する役割を担っている。
これらの合成表現を用いて検出モデルを訓練することにより、不注意な共起背景の影響を最小限に抑えながら、一定の前景コンテンツに焦点を合わせることをモデルに強制する。
私たちの知る限りでは、この方向への最初の試みである。
いくつかのベンチマークでの大規模な実験により、Counterfactual-CAMは偏りのあるアクティベーション問題を緩和し、オブジェクトのローカライゼーション精度の向上を実現している。
関連論文リスト
- Towards Robust Trajectory Representations: Isolating Environmental Confounders with Causal Learning [23.659451444973627]
本稿では、因果学習に基づく軌道モデリングフレームワーク(TrajCL)を提案する。
TrajCLは、より優れた一般化と解釈可能性を示しながら、軌道分類タスクのパフォーマンスを著しく向上させる。
論文 参考訳(メタデータ) (2024-04-22T10:34:58Z) - Causality-based Cross-Modal Representation Learning for
Vision-and-Language Navigation [15.058687283978077]
VLN(Vision-and-Language Navigation)は、現実のシナリオに応用される可能性から、近年、大きな研究の関心を集めている。
既存のVLN法は、急激な関連の問題に苦慮し、その結果、目に見える環境と目に見えない環境の間に大きな性能差があるような一般化が不十分になる。
本稿では,因果学習パラダイムに基づく統一的なフレームワークCausalVLNを提案する。
論文 参考訳(メタデータ) (2024-03-06T02:01:38Z) - Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement [58.9768112704998]
遠方表現学習は、観測データ内の本質的要因を抽出する試みである。
我々は新しい視点と枠組みを導入し、クロスアテンションを持つ拡散モデルが強力な帰納バイアスとなることを示す。
これは、複雑な設計を必要とせず、クロスアテンションを持つ拡散モデルの強力な解離能力を明らかにする最初の研究である。
論文 参考訳(メタデータ) (2024-02-15T05:07:54Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - Introducing Foundation Models as Surrogate Models: Advancing Towards
More Practical Adversarial Attacks [15.882687207499373]
箱なしの敵攻撃は、AIシステムにとってより実用的で難しいものになりつつある。
本稿では,サロゲートモデルとして基礎モデルを導入することにより,逆攻撃を下流タスクとして再放送する。
論文 参考訳(メタデータ) (2023-07-13T08:10:48Z) - Context De-confounded Emotion Recognition [12.037240778629346]
コンテキストアウェア感情認識(CAER)は、対象者の感情状態を文脈情報で知覚することを目的としている。
長年見過ごされてきた問題は、既存のデータセットのコンテキストバイアスが感情状態のかなり不均衡な分布をもたらすことである。
本稿では、そのようなバイアスの影響からモデルを切り離し、CAERタスクにおける変数間の因果関係を定式化する因果関係に基づく視点を提供する。
論文 参考訳(メタデータ) (2023-03-21T15:12:20Z) - Causal Triplet: An Open Challenge for Intervention-centric Causal
Representation Learning [98.78136504619539]
Causal Tripletは、視覚的に複雑なシーンを特徴とする因果表現学習ベンチマークである。
この結果から,不整合表現やオブジェクト中心表現の知識によって構築されたモデルが,分散表現よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2023-01-12T17:43:38Z) - Knowledge-guided Causal Intervention for Weakly-supervised Object
Localization [32.99508048913356]
KG-CI-CAMは知識誘導因果介入法である。
我々は、因果介入による共起コンテキスト共同設立問題に取り組む。
分類知識の吸収と局所化知識のバランスをとるための多元的知識指導フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-03T12:02:19Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - A Unified Contrastive Energy-based Model for Understanding the
Generative Ability of Adversarial Training [64.71254710803368]
Adversarial Training (AT) は、ディープニューラルネットワークの堅牢性を高める効果的なアプローチである。
我々は、Contrastive Energy-based Models(CEM)と呼ばれる統合確率的枠組みを開発することにより、この現象をデミステレーションする。
本稿では,逆学習法とサンプリング法を開発するための原則的手法を提案する。
論文 参考訳(メタデータ) (2022-03-25T05:33:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。