論文の概要: Adversarial Domain Prompt Tuning and Generation for Single Domain Generalization
- arxiv url: http://arxiv.org/abs/2606.21736v1
- Date: Fri, 19 Jun 2026 20:46:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 03:39:09.527077
- Title: Adversarial Domain Prompt Tuning and Generation for Single Domain Generalization
- Title(参考訳): 単一領域一般化のための対向領域プロンプトチューニングと生成
- Authors: Zhipeng Xu, De Cheng, Xinyang Jiang, Nannan Wang, Dongsheng Li, Xinbo Gao,
- Abstract要約: 単一ドメインの一般化は、目に見えない多くのドメインでうまく機能する堅牢なモデルを学ぶことを目的としている。
単一ドメインの一般化を達成するための有望な方向の1つは、データ拡張や画像生成を通じて、外部ドメイン(OOD)のトレーニングデータを生成することである。
本稿では,T2I基盤モデルを利用したトレーニングデータ作成手法を提案する。
- 参考スコア(独自算出の注目度): 105.71296914822898
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single domain generalization (SDG) aims to learn a robust model, which could perform well on many unseen domains while there is only one single domain available for training. One of the promising directions for achieving single-domain generalization is to generate out-of-domain (OOD) training data through data augmentation or image generation. Given the rapid advancements in AI-generated content (AIGC), this paper is the first to propose leveraging powerful pre-trained text-to-image (T2I) foundation models to create the training data. However, manually designing textual prompts to generate images for all possible domains is often impractical, and some domain characteristics may be too abstract to describe with words. To address these challenges, we propose a novel Progressive Adversarial Prompt Tuning (PAPT) framework for pre-trained diffusion models. Instead of relying on static textual domains, our approach learns two sets of abstract prompts as conditions for the diffusion model: one that captures domain-invariant category information and another that models domain-specific styles. This adversarial learning mechanism enables the T2I model to generate images in various domain styles while preserving key categorical features. Extensive experiments demonstrate the effectiveness of the proposed method, achieving superior performances to state-of-the-art single-domain generalization approaches.
- Abstract(参考訳): 単一のドメイン一般化(SDG)は、トレーニングに利用可能な単一のドメインが1つしかない間、見えない多くのドメインでうまく機能する堅牢なモデルを学ぶことを目的としている。
単一ドメインの一般化を達成するための有望な方向の1つは、データ拡張や画像生成を通じて、外部ドメイン(OOD)のトレーニングデータを生成することである。
AIGC(AIGC)の急速な進歩を踏まえ、この論文は、トレーニングデータを作成するために、強力な事前学習されたテキスト・ツー・イメージ(T2I)基盤モデルを活用することを提案する最初のものである。
しかし、可能なすべての領域に対して画像を生成するために手動でテキストプロンプトを設計するのは現実的ではなく、いくつかのドメインの特徴は言葉で記述するには抽象的すぎるかもしれない。
これらの課題に対処するため,我々は,事前学習した拡散モデルのための新しいプログレッシブ・アドバイサル・プロンプト・チューニング(PAPT)フレームワークを提案する。
静的なテキストドメインに頼る代わりに、拡散モデルの条件として2つの抽象的なプロンプトを学習する。
この逆学習機構により、T2Iモデルは、キーカテゴリの特徴を保ちながら、様々なドメインスタイルの画像を生成することができる。
大規模実験により提案手法の有効性が実証され,最先端の単一領域一般化手法に優れた性能が得られた。
関連論文リスト
- Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - Phrase Grounding-based Style Transfer for Single-Domain Generalized
Object Detection [109.58348694132091]
単一ドメインの一般化オブジェクト検出は、複数の未確認対象ドメインに対するモデルの一般化性を高めることを目的としている。
これは、ターゲットのドメインデータをトレーニングに組み込むことなく、ドメインシフトに対処するモデルを必要とするため、実用的だが難しいタスクである。
そこで我々は,課題に対する新しい文節接頭辞に基づくスタイル伝達手法を提案する。
論文 参考訳(メタデータ) (2024-02-02T10:48:43Z) - Image is All You Need to Empower Large-scale Diffusion Models for In-Domain Generation [7.1629002695210024]
ドメイン内生成は、unconditional generation、text-to-image、画像編集、3D生成など、特定のドメイン内でさまざまなタスクを実行することを目的としている。
初期の研究は通常、特定のタスクとドメインごとに特別なジェネレータを訓練する必要があり、しばしば完全にラベル付けされたデータに依存していた。
強力な生成能力と拡散モデルの幅広い応用により、私たちは、これらのモデルをドメイン内生成に活用するためにラベルのないデータを活用することを模索しています。
論文 参考訳(メタデータ) (2023-12-13T14:59:49Z) - Can Out-of-Domain data help to Learn Domain-Specific Prompts for Multimodal Misinformation Detection? [14.722270908687216]
ドメイン固有のPromptチューニングは、トレーニング中にドメイン外のデータを利用して、すべての望ましいドメインの偽ニュース検出を同時に改善する。
大規模なNewsCLIPpingとVERITEベンチマークの実験は、DPODがこの課題に対して最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2023-11-27T08:49:26Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Prompting Diffusion Representations for Cross-Domain Semantic
Segmentation [101.04326113360342]
拡散事前学習は、セマンティックセグメンテーションのための並外れた領域一般化結果を達成する。
本研究では,シーンプロンプトとプロンプトランダム化戦略を導入し,セグメンテーションヘッドを訓練する際に,ドメイン不変情報をさらに混乱させる。
論文 参考訳(メタデータ) (2023-07-05T09:28:25Z) - Learning Domain Invariant Prompt for Vision-Language Models [31.581652862478965]
本稿では,メタプロンプト(MetaPrompt)と呼ばれる未確認領域に一般化可能な,固有領域不変プロンプトを直接生成する新しいプロンプト学習パラダイムを提案する。
我々の手法は既存の手法より一貫して大幅に優れています。
論文 参考訳(メタデータ) (2022-12-08T11:23:24Z) - TAL: Two-stream Adaptive Learning for Generalizable Person
Re-identification [115.31432027711202]
我々は、ドメイン固有性とドメイン不変性の両方が、re-idモデルの一般化能力の向上に不可欠であると主張する。
これら2種類の情報を同時にモデル化するために,2ストリーム適応学習 (TAL) を命名した。
我々のフレームワークは、単一ソースとマルチソースの両方のドメイン一般化タスクに適用できる。
論文 参考訳(メタデータ) (2021-11-29T01:27:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。