論文の概要: Semi-Supervised Domain Generalization for Object Detection via
Language-Guided Feature Alignment
- arxiv url: http://arxiv.org/abs/2309.13525v1
- Date: Sun, 24 Sep 2023 02:10:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 19:11:25.026887
- Title: Semi-Supervised Domain Generalization for Object Detection via
Language-Guided Feature Alignment
- Title(参考訳): 言語誘導的特徴アライメントによるオブジェクト検出のための半教師付きドメイン一般化
- Authors: Sina Malakouti, Adriana Kovashka
- Abstract要約: 既存のドメイン適応(DA)と一般化(DG)メソッドは、オブジェクトの外観の多様性やシーンの複雑さといった課題に直面している。
我々は、視覚言語による事前学習と言語空間における機能アライメントの実施により、半教師付き領域一般化の問題に最初に対処する。
我々は,埋め込み空間におけるドメイン固有の特徴の異なる画像の記述の一致を最大化するために,クロスドメイン記述型マルチスケール学習(CDDMSL)を新たに導入した。
- 参考スコア(独自算出の注目度): 33.66537809438079
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing domain adaptation (DA) and generalization (DG) methods in object
detection enforce feature alignment in the visual space but face challenges
like object appearance variability and scene complexity, which make it
difficult to distinguish between objects and achieve accurate detection. In
this paper, we are the first to address the problem of semi-supervised domain
generalization by exploring vision-language pre-training and enforcing feature
alignment through the language space. We employ a novel Cross-Domain
Descriptive Multi-Scale Learning (CDDMSL) aiming to maximize the agreement
between descriptions of an image presented with different domain-specific
characteristics in the embedding space. CDDMSL significantly outperforms
existing methods, achieving 11.7% and 7.5% improvement in DG and DA settings,
respectively. Comprehensive analysis and ablation studies confirm the
effectiveness of our method, positioning CDDMSL as a promising approach for
domain generalization in object detection tasks.
- Abstract(参考訳): オブジェクト検出における既存のドメイン適応(da)と一般化(dg)メソッドは、視覚空間に機能アライメントを強制するが、オブジェクトの出現変動やシーンの複雑さといった課題に直面するため、オブジェクトの区別と正確な検出が困難になる。
本稿では,視覚言語による事前学習と言語空間における機能アライメントの実施により,半教師付き領域一般化の問題に最初に対処する。
我々は,埋め込み空間におけるドメイン固有の特徴の異なる画像の記述の一致を最大化するために,クロスドメイン記述型マルチスケール学習(CDDMSL)を新たに導入した。
CDDMSLは既存の手法よりも優れており、それぞれDGとDAの設定が11.7%と7.5%改善している。
本手法の有効性を総合解析およびアブレーション研究により確認し,CDDMSLをオブジェクト検出タスクにおける領域一般化のための有望なアプローチとして位置づけた。
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - TeG-DG: Textually Guided Domain Generalization for Face Anti-Spoofing [8.830873674673828]
既存の方法は、様々な訓練領域からドメイン不変の特徴を抽出することを目的としている。
抽出された特徴は、必然的に残差スタイルの特徴バイアスを含んでおり、その結果、一般化性能が劣る。
本稿では,テキスト情報をドメイン間アライメントに有効活用するテキストガイド型ドメイン一般化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-30T10:13:46Z) - Unified Domain Adaptive Semantic Segmentation [96.74199626935294]
Unsupervised Adaptive Domain Semantic (UDA-SS)は、ラベル付きソースドメインからラベル付きターゲットドメインに監督を移すことを目的としている。
本稿では,特徴量と特徴量との相違に対処するQuad-directional Mixup(QuadMix)法を提案する。
提案手法は,4つの挑戦的UDA-SSベンチマークにおいて,最先端の成果を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2023-11-22T09:18:49Z) - Towards Domain-Specific Features Disentanglement for Domain
Generalization [23.13095840134744]
そこで本研究では,見過ごされがちな領域特化特徴を生かした,新しいコントラッシブ・ベース・ディコンタンジメント法CDDGを提案する。
具体的には、CDDGは、潜在空間においてそれらを活用することによって、固有の排他的特徴を分離することを学ぶ。
各種ベンチマークデータセットを用いて行った実験は,他の最先端手法と比較して,本手法の優位性を示した。
論文 参考訳(メタデータ) (2023-10-04T17:51:02Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - Decompose to Adapt: Cross-domain Object Detection via Feature
Disentanglement [79.2994130944482]
本研究では,DDF(Domain Disentanglement Faster-RCNN)を設計し,タスク学習のための特徴のソース固有情報を排除した。
DDF法は,グローバルトリプルト・ディアンタングルメント(GTD)モジュールとインスタンス類似性・ディアンタングルメント(ISD)モジュールを用いて,グローバルおよびローカルステージでの機能ディアンタングルを容易にする。
提案手法は,4つのUDAオブジェクト検出タスクにおいて最先端の手法より優れており,広い適用性で有効であることが実証された。
論文 参考訳(メタデータ) (2022-01-06T05:43:01Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。