論文の概要: Mitigating Context Bias in Domain Adaptation for Object Detection using Mask Pooling
- arxiv url: http://arxiv.org/abs/2505.18446v1
- Date: Sat, 24 May 2025 01:05:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.428017
- Title: Mitigating Context Bias in Domain Adaptation for Object Detection using Mask Pooling
- Title(参考訳): マスクプーリングを用いた物体検出のための領域適応におけるコンテキストバイアスの緩和
- Authors: Hojun Son, Asma Almutairi, Arpan Kusari,
- Abstract要約: コンテキストバイアス(Context bias)とは、オブジェクト検出トレーニングプロセスにおいて、前景オブジェクトと背景の関係を指す。
我々は、畳み込みネットワークアーキテクチャにおけるプール操作を、このバイアスの可能な源として、コンテキストバイアスの因果的視点を提供する。
本研究では,前景マスクの追加入力を用いて,前景と背景領域のプール処理を分離するマスクプーリングを提案する。
- 参考スコア(独自算出の注目度): 1.1060425537315088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context bias refers to the association between the foreground objects and background during the object detection training process. Various methods have been proposed to minimize the context bias when applying the trained model to an unseen domain, known as domain adaptation for object detection (DAOD). But a principled approach to understand why the context bias occurs and how to remove it has been missing. In this work, we provide a causal view of the context bias, pointing towards the pooling operation in the convolution network architecture as the possible source of this bias. We present an alternative, Mask Pooling, which uses an additional input of foreground masks, to separate the pooling process in the respective foreground and background regions and show that this process leads the trained model to detect objects in a more robust manner under different domains. We also provide a benchmark designed to create an ultimate test for DAOD, using foregrounds in the presence of absolute random backgrounds, to analyze the robustness of the intended trained models. Through these experiments, we hope to provide a principled approach for minimizing context bias under domain shift.
- Abstract(参考訳): コンテキストバイアス(Context bias)とは、オブジェクト検出トレーニングプロセスにおいて、前景オブジェクトと背景の関係を指す。
オブジェクト検出のためのドメイン適応(DAOD)として知られる、未確認領域にトレーニングされたモデルを適用する際のコンテキストバイアスを最小限に抑える様々な手法が提案されている。
しかし、なぜコンテキストバイアスが発生し、どのように取り除くかを理解するための原則化されたアプローチが欠落しています。
本研究では,コンボリューションネットワークアーキテクチャにおけるプール動作を,このバイアスの発生源とみなして,コンテキストバイアスの因果的視点を提供する。
本研究では,前景マスクの追加入力を用いて,各前景領域と背景領域のプーリング処理を分離するMask Poolingを提案する。
また、絶対ランダムな背景が存在する場合の前景を用いてDAODの究極のテストを作成するために設計されたベンチマークを作成し、意図されたトレーニングモデルのロバスト性を分析する。
これらの実験を通じて、ドメインシフトの下でコンテキストバイアスを最小限にするための原則的なアプローチを提供したいと思っています。
関連論文リスト
- ALBAR: Adversarial Learning approach to mitigate Biases in Action Recognition [52.537021302246664]
行動認識モデルは、しばしば背景バイアス(背景の手がかりに基づく行動の推測)と前景バイアス(主題の外観に依存する)に悩まされる。
本稿では,前景や背景のバイアスを,バイアス特性の専門知識を必要とせずに軽減する,新たな対人訓練手法であるALBARを提案する。
我々は,提案手法を確立された背景と前景のバイアスプロトコル上で評価し,新しい最先端のバイアスプロトコルを設定し,HMDB51では12%以上のデバイアス性能を向上した。
論文 参考訳(メタデータ) (2025-01-31T20:47:06Z) - Differential Alignment for Domain Adaptive Object Detection [13.664876152118165]
ドメイン適応オブジェクト検出(DAOD)は、ラベル付きソースドメインデータに基づいてトレーニングされたオブジェクト検出器をアノテーションなしでターゲットドメインに一般化することを目的としている。
既存のアプローチでは、ソースとターゲットドメイン全体の分布を調整するために、逆学習を採用している。
本稿では,その欠点を克服するための特徴アライメント戦略を提案する。
論文 参考訳(メタデータ) (2024-12-17T11:52:10Z) - Quantifying Context Bias in Domain Adaptation for Object Detection [1.1060425537315088]
オブジェクト検出のためのドメイン適応(DAOD)は、トレーニングされたモデルをソースからターゲットドメインに転送しようとする。
我々は、適応中の背景特徴の変化と、異なる領域におけるコンテキストバイアスがどのように表現されるかを分析する。
現状のドメイン適応手法はある種のコンテキストバイアスを示し、コンテキストバイアスを軽減するために潜在的に単純な方法を適用する。
論文 参考訳(メタデータ) (2024-09-23T03:01:50Z) - Consistency Regularisation for Unsupervised Domain Adaptation in Monocular Depth Estimation [15.285720572043678]
整合性に基づく半教師付き学習問題として,単眼深度推定のための教師なし領域適応を定式化する。
複数の拡張ビューにまたがって一貫性を保ちながら、ソースドメイン上の予測を規則化するペアワイズ損失関数を導入する。
実験では, KITTI と NYUv2 の標準深度推定ベンチマークを用いて,最先端の結果を示す。
論文 参考訳(メタデータ) (2024-05-27T23:32:06Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Instance Relation Graph Guided Source-Free Domain Adaptive Object
Detection [79.89082006155135]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ドメインシフトの問題に取り組むための効果的なアプローチである。
UDAメソッドは、ターゲットドメインの一般化を改善するために、ソースとターゲット表現を整列させようとする。
Source-Free Adaptation Domain (SFDA)設定は、ソースデータへのアクセスを必要とせずに、ターゲットドメインに対してソーストレーニングされたモデルを適用することで、これらの懸念を軽減することを目的としている。
論文 参考訳(メタデータ) (2022-03-29T17:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。