論文の概要: Unbiased Faster R-CNN for Single-source Domain Generalized Object Detection
- arxiv url: http://arxiv.org/abs/2405.15225v1
- Date: Fri, 24 May 2024 05:34:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 17:59:14.984945
- Title: Unbiased Faster R-CNN for Single-source Domain Generalized Object Detection
- Title(参考訳): 単一ソース領域一般化オブジェクト検出のための非バイアス高速R-CNN
- Authors: Yajing Liu, Shijun Zhou, Xiyao Liu, Chunhui Hao, Baojie Fan, Jiandong Tian,
- Abstract要約: 一般化可能な特徴学習のためのUnbiased Faster R-CNN (UFR)を提案する。
具体的には、因果的観点からの物体検出を定式化し、データバイアスとタスクの特徴バイアスを分析する構造因果モデル(SCM)を構築する。
5つの場面における実験結果から,本手法の顕著な一般化能力が示され,ナイトクリアシーンでは3.9%のmAPが向上した。
- 参考スコア(独自算出の注目度): 35.71100602593928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-source domain generalization (SDG) for object detection is a challenging yet essential task as the distribution bias of the unseen domain degrades the algorithm performance significantly. However, existing methods attempt to extract domain-invariant features, neglecting that the biased data leads the network to learn biased features that are non-causal and poorly generalizable. To this end, we propose an Unbiased Faster R-CNN (UFR) for generalizable feature learning. Specifically, we formulate SDG in object detection from a causal perspective and construct a Structural Causal Model (SCM) to analyze the data bias and feature bias in the task, which are caused by scene confounders and object attribute confounders. Based on the SCM, we design a Global-Local Transformation module for data augmentation, which effectively simulates domain diversity and mitigates the data bias. Additionally, we introduce a Causal Attention Learning module that incorporates a designed attention invariance loss to learn image-level features that are robust to scene confounders. Moreover, we develop a Causal Prototype Learning module with an explicit instance constraint and an implicit prototype constraint, which further alleviates the negative impact of object attribute confounders. Experimental results on five scenes demonstrate the prominent generalization ability of our method, with an improvement of 3.9% mAP on the Night-Clear scene.
- Abstract(参考訳): オブジェクト検出のための単一ソース領域一般化(SDG)は、未確認領域の分布バイアスがアルゴリズム性能を著しく低下させるため、難しいが必須課題である。
しかし、既存の手法では、バイアス付きデータがネットワークに非因果的で一般化不可能なバイアス付き特徴を学習させるのを無視して、ドメイン不変の特徴を抽出しようと試みている。
この目的のために,Unbiased Faster R-CNN (UFR) を提案する。
具体的には、因果的観点からのオブジェクト検出においてSDGを定式化し、そのタスクにおけるデータバイアスと特徴バイアスを分析する構造因果モデル(Structure Causal Model, SCM)を構築する。
SCMに基づいて,データ拡張のためのグローバルローカル変換モジュールを設計し,ドメインの多様性を効果的にシミュレートし,データのバイアスを軽減する。
さらに,シーン共同創設者にとって堅牢な画像レベルの特徴を学習するために,デザインされた注意不分散損失を取り入れた因果注意学習モジュールを導入する。
さらに,明示的なインスタンス制約と暗黙的なプロトタイプ制約を備えたCausal Prototype Learningモジュールを開発した。
5つの場面における実験結果から,本手法の顕著な一般化能力が示され,ナイトクリアシーンでは3.9%のmAPが向上した。
関連論文リスト
- DECIDER: Leveraging Foundation Model Priors for Improved Model Failure Detection and Explanation [18.77296551727931]
本稿では,大規模言語モデル (LLM) と視覚言語モデル (VLM) の先行情報を利用した画像モデルの故障検出手法であるDECIDERを提案する。
DECIDERは一貫して最先端の故障検出性能を達成し、マシューズ相関係数全体のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2024-08-01T07:08:11Z) - A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。
CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。
本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文 参考訳(メタデータ) (2024-07-31T08:42:48Z) - Imbalanced Graph-Level Anomaly Detection via Counterfactual Augmentation and Feature Learning [1.3756846638796]
本稿では,非バランスなGLAD手法を提案する。
我々は、このモデルを脳疾患データセットに適用し、我々の研究の能力を証明することができる。
論文 参考訳(メタデータ) (2024-07-13T13:40:06Z) - Causal Prototype-inspired Contrast Adaptation for Unsupervised Domain
Adaptive Semantic Segmentation of High-resolution Remote Sensing Imagery [8.3316355693186]
本稿では,異なるHRSIsドメインとそれらの意味ラベル間の不変因果機構を探索するプロトタイプインスパイアされたコントラスト適応(CPCA)手法を提案する。
ソースとターゲットのドメインイメージから因果的特徴とバイアス的特徴を、因果的特徴のアンタングルメントモジュールを通じて切り離す。
さらに因果的・偏見的特徴を非相関化するために、因果的介入モジュールを導入してバイアス的特徴に介入し、反事実的非偏見的サンプルを生成する。
論文 参考訳(メタデータ) (2024-03-06T13:39:18Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。
GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文 参考訳(メタデータ) (2021-12-20T14:47:32Z) - Calibrated Feature Decomposition for Generalizable Person
Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。
キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-11-27T17:12:43Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。