論文の概要: Phrase Grounding-based Style Transfer for Single-Domain Generalized
Object Detection
- arxiv url: http://arxiv.org/abs/2402.01304v2
- Date: Mon, 5 Feb 2024 03:04:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 11:58:42.613851
- Title: Phrase Grounding-based Style Transfer for Single-Domain Generalized
Object Detection
- Title(参考訳): フレーズ接地に基づく単一領域一般化物体検出のためのスタイル転送
- Authors: Hao Li, Wei Wang, Cong Wang, Zhigang Luo, Xinwang Liu, Kenli Li and
Xiaochun Cao
- Abstract要約: 単一ドメインの一般化オブジェクト検出は、複数の未確認対象ドメインに対するモデルの一般化性を高めることを目的としている。
これは、ターゲットのドメインデータをトレーニングに組み込むことなく、ドメインシフトに対処するモデルを必要とするため、実用的だが難しいタスクである。
そこで我々は,課題に対する新しい文節接頭辞に基づくスタイル伝達手法を提案する。
- 参考スコア(独自算出の注目度): 109.58348694132091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-domain generalized object detection aims to enhance a model's
generalizability to multiple unseen target domains using only data from a
single source domain during training. This is a practical yet challenging task
as it requires the model to address domain shift without incorporating target
domain data into training. In this paper, we propose a novel phrase
grounding-based style transfer (PGST) approach for the task. Specifically, we
first define textual prompts to describe potential objects for each unseen
target domain. Then, we leverage the grounded language-image pre-training
(GLIP) model to learn the style of these target domains and achieve style
transfer from the source to the target domain. The style-transferred source
visual features are semantically rich and could be close to imaginary
counterparts in the target domain. Finally, we employ these style-transferred
visual features to fine-tune GLIP. By introducing imaginary counterparts, the
detector could be effectively generalized to unseen target domains using only a
single source domain for training. Extensive experimental results on five
diverse weather driving benchmarks demonstrate our proposed approach achieves
state-of-the-art performance, even surpassing some domain adaptive methods that
incorporate target domain images into the training process.The source codes and
pre-trained models will be made available.
- Abstract(参考訳): 単一ドメインの一般化オブジェクト検出は、トレーニング中に単一のソースドメインのデータのみを使用して、複数の未確認対象ドメインに対するモデルの一般化性を高めることを目的としている。
ターゲットとなるドメインデータをトレーニングに組み込むことなく、モデルがドメインシフトに対処する必要があるため、これは実用的かつ困難なタスクです。
本稿では,この課題に対する新しい文節接地型スタイル転送(PGST)手法を提案する。
具体的には、まず、対象領域ごとに潜在的なオブジェクトを記述するためのテキストプロンプトを定義します。
次に,glip(grounded language-image pre-training)モデルを用いて,対象領域のスタイルを学習し,ソースから対象領域へのスタイル転送を実現する。
スタイル変換されたソースの視覚機能はセマンティックにリッチであり、ターゲットドメインの想像上の機能に近い可能性がある。
最後に、これらのスタイル変換された視覚特徴を用いて、GLIPを微調整する。
想像上の相手を導入することで、検出器は訓練のために単一のソースドメインのみを使用して、効果的に標的ドメインに一般化できる。
提案手法は,訓練プロセスに対象のドメインイメージを組み込んだいくつかのドメイン適応手法を超越した,最先端の性能を実現することを実証し,ソースコードと事前訓練済みモデルを利用可能とする。
関連論文リスト
- Domain-Rectifying Adapter for Cross-Domain Few-Shot Segmentation [40.667166043101076]
多様なターゲットドメインスタイルをソースドメインに修正するための小さなアダプタを提案する。
アダプタは、さまざまな合成対象ドメインから画像特徴を修正して、ソースドメインと整合するように訓練される。
提案手法は,ドメイン間複数ショットセマンティックセマンティックセグメンテーションタスクにおいて有望な結果を得る。
論文 参考訳(メタデータ) (2024-04-16T07:07:40Z) - Online Prototype Alignment for Few-shot Policy Transfer [18.310398679044244]
本稿では,要素の機能的類似性に基づいてマッピング関数を学習する新しいフレームワークを提案する。
オンラインプロトタイプアライメント(OPA)は、わずか数回で数発のポリシー転送を達成できる。
論文 参考訳(メタデータ) (2023-06-12T11:42:13Z) - Pulling Target to Source: A New Perspective on Domain Adaptive Semantic
Segmentation [60.78786037080524]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインからラベルなしターゲットドメインに知識を転送することを目的としています。
我々はT2S-DAを提案し、T2S-DAはドメイン適応のためのソースにターゲットを引っ張る形式として解釈する。
論文 参考訳(メタデータ) (2023-05-23T07:09:09Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - P{\O}DA: Prompt-driven Zero-shot Domain Adaptation [27.524962843495366]
我々は,対象領域の自然言語,すなわちプロンプトの一般的な記述のみを用いて,ソースドメイン上で訓練されたモデルを適用する。
本稿では,これらのプロンプト駆動による拡張が,セマンティックセグメンテーションのためのゼロショットドメイン適応の実行に有効であることを示す。
論文 参考訳(メタデータ) (2022-12-06T18:59:58Z) - Domain Adaptation via Prompt Learning [39.97105851723885]
Unsupervised Domain Adaption (UDA) は、十分にアノテーションされたソースドメインから学習したモデルをターゲットドメインに適応させることを目的としている。
我々は,Prompt Learning (DAPL) によるドメイン適応という,UDAのための新しいプロンプト学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-02-14T13:25:46Z) - Generalized Source-free Domain Adaptation [47.907168218249694]
我々は、G-SFDA(Generalized Source-free Domain Adaptation)と呼ばれる新しいドメイン適応パラダイムを提案する。
目標性能は既存の DA 法や SFDA 法と同等かそれ以上であり、特に VisDA の最先端性能 (85.4%) を達成する。
論文 参考訳(メタデータ) (2021-08-03T16:34:12Z) - Surprisingly Simple Semi-Supervised Domain Adaptation with Pretraining
and Consistency [93.89773386634717]
ビジュアルドメイン適応は、異なるソースドメインで利用可能なラベルを使用して、ターゲットのビジュアルドメインからイメージを分類する学習を含む。
いくつかの目標ラベルが存在する場合、(回転予測による)自己スーパービジョンや整合正則化といった単純な手法が、適切な目標分類器を学習するための対角アライメントなしで有効であることを示す。
我々の事前学習と一貫性(PAC)アプローチは、この半教師付きドメイン適応タスクにおいて、複数のデータセットにまたがる複数の対向的なドメインアライメント手法を超越して、技術精度を達成することができる。
論文 参考訳(メタデータ) (2021-01-29T18:40:17Z) - Alleviating Semantic-level Shift: A Semi-supervised Domain Adaptation
Method for Semantic Segmentation [97.8552697905657]
このタスクの重要な課題は、ソースとターゲットドメイン間のデータ分散の相違を緩和する方法である。
本稿では,グローバルな視点とローカルな視点の両方から分布の整合性を促進できるASS(Alleviating Semantic-level Shift)を提案する。
GTA5、Cityscapes、Synthia、Cityscapesの2つのドメイン適応タスクにASSを適用します。
論文 参考訳(メタデータ) (2020-04-02T03:25:05Z) - Cross-domain Self-supervised Learning for Domain Adaptation with Few
Source Labels [78.95901454696158]
ドメイン適応のためのクロスドメイン自己教師型学習手法を提案する。
本手法は,ソースラベルが少ない新しいターゲット領域において,ターゲット精度を著しく向上させる。
論文 参考訳(メタデータ) (2020-03-18T15:11:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。