論文の概要: Towards Domain Generalization in Object Detection
- arxiv url: http://arxiv.org/abs/2203.14387v1
- Date: Sun, 27 Mar 2022 20:35:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 12:43:04.896053
- Title: Towards Domain Generalization in Object Detection
- Title(参考訳): 物体検出における領域一般化に向けて
- Authors: Xingxuan Zhang, Zekai Xu, Renzhe Xu, Jiashuo Liu, Peng Cui, Weitao
Wan, Chong Sun, Chen Li
- Abstract要約: 本研究では,物体検出(DGOD)における領域一般化という重要な問題について検討し,検出器をソースドメインで訓練し,未知のターゲットドメインで評価する。
本稿では,RoI特徴量への依存を解消するため,RAPT(Rerea Aware Proposal reweighTing)という新しい手法を提案する。
- 参考スコア(独自算出の注目度): 32.68332102237882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the striking performance achieved by modern detectors when training
and test data are sampled from the same or similar distribution, the
generalization ability of detectors under unknown distribution shifts remains
hardly studied. Recently several works discussed the detectors' adaptation
ability to a specific target domain which are not readily applicable in
real-world applications since detectors may encounter various environments or
situations while pre-collecting all of them before training is inconceivable.
In this paper, we study the critical problem, domain generalization in object
detection (DGOD), where detectors are trained with source domains and evaluated
on unknown target domains. To thoroughly evaluate detectors under unknown
distribution shifts, we formulate the DGOD problem and propose a comprehensive
evaluation benchmark to fill the vacancy. Moreover, we propose a novel method
named Region Aware Proposal reweighTing (RAPT) to eliminate dependence within
RoI features. Extensive experiments demonstrate that current DG methods fail to
address the DGOD problem and our method outperforms other state-of-the-art
counterparts.
- Abstract(参考訳): トレーニングデータとテストデータが同一あるいは類似の分布からサンプリングされる場合、現代の検出器が達成した顕著な性能にもかかわらず、未知の分布シフト下での検出器の一般化能力はほとんど研究されていない。
近年、検出器は様々な環境や状況に遭遇する可能性があるため、現実の応用では適用できない特定の対象領域への適応能力について議論されている。
本稿では,オブジェクト検出(DGOD)における重要な問題,ドメインの一般化について検討し,検出器をソースドメインで訓練し,未知のターゲットドメインで評価する。
未知分布シフト下の検出器を徹底的に評価するために,dgod問題を定式化し,空隙を満たすための総合評価ベンチマークを提案する。
さらに,roi特徴の依存性をなくすため,rapt法という新しい手法を提案する。
大規模な実験により、現在のDG法はDGOD問題に対処できず、我々の手法は他の最先端の手法よりも優れていることが示された。
関連論文リスト
- Disentangling Masked Autoencoders for Unsupervised Domain Generalization [57.56744870106124]
教師なしの領域一般化は急速に注目されているが、まだ十分に研究されていない。
Disentangled Masked Auto (DisMAE) は、本質的な特徴を忠実に示す不整合表現を発見することを目的としている。
DisMAEは、セマンティックで軽量な変分エンコーダを備えた非対称なデュアルブランチアーキテクチャを共同で訓練する。
論文 参考訳(メタデータ) (2024-07-10T11:11:36Z) - DSD-DA: Distillation-based Source Debiasing for Domain Adaptive Object Detection [37.01880023537362]
我々は、ドメイン適応オブジェクト検出(DAOD)のための新しい蒸留系ソースデバイアス(DSD)フレームワークを提案する。
このフレームワークは、事前訓練された教師モデルからドメインに依存しない知識を抽出し、両方のドメインにおける検出器の性能を向上させる。
また,DCE(Domain-Aware Consistency Enhancing)戦略を提案し,これらの情報を新たなローカライゼーション表現に定式化する。
論文 参考訳(メタデータ) (2023-11-17T10:26:26Z) - Towards Reliable Domain Generalization: A New Dataset and Evaluations [45.68339440942477]
我々は手書き文字認識(HCCR)のための新しい領域一般化タスクを提案する。
提案したPaHCCデータセット上で18のDG手法を評価し,既存の手法の性能がまだ不十分であることを示す。
私たちのデータセットと評価は、コミュニティに新たな視点をもたらし、より実質的な進歩をもたらします。
論文 参考訳(メタデータ) (2023-09-12T11:29:12Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - On Certifying and Improving Generalization to Unseen Domains [87.00662852876177]
ドメインの一般化は、テスト時に遭遇した見知らぬドメインのパフォーマンスが高いモデルを学ぶことを目的としています。
いくつかのベンチマークデータセットを使用して、DGアルゴリズムを包括的に評価することは困難である。
我々は,任意のDG手法の最悪の性能を効率的に証明できる普遍的な認証フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-24T16:29:43Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - Unsupervised Out-of-Domain Detection via Pre-trained Transformers [56.689635664358256]
ドメイン外の入力は予測不能なアウトプットを引き起こし、時には破滅的な安全性の問題を引き起こす。
本研究は、教師なしのドメイン内データのみを用いて、ドメイン外サンプルを検出する問題に対処する。
検出精度を高めるために、ドメイン固有の2つの微調整手法が提案されている。
論文 参考訳(メタデータ) (2021-06-02T05:21:25Z) - Adversarial Unsupervised Domain Adaptation Guided with Deep Clustering
for Face Presentation Attack Detection [0.8701566919381223]
顔提示攻撃検知(PAD)は顔認識システムを確保するために注目されている。
PAD一般化能力を改善するために,ドメイン適応(DA)に基づくエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-13T05:34:40Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。