論文の概要: BatStyler: Advancing Multi-category Style Generation for Source-free Domain Generalization
- arxiv url: http://arxiv.org/abs/2501.01109v1
- Date: Thu, 02 Jan 2025 07:14:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:16:25.270808
- Title: BatStyler: Advancing Multi-category Style Generation for Source-free Domain Generalization
- Title(参考訳): BatStyler: ソースフリードメイン一般化のためのマルチカテゴリスタイル生成の改善
- Authors: Xiusheng Xu, Lei Qi, Jingyang Zhou, Xin Geng,
- Abstract要約: Source-Free Domain Generalizationは、ソースドメインに頼ることなく、目に見えないドメインで実行するモデルを開発することを目的としている。
SFDGにおけるマルチモーダルモデルの知識伝達と複数モーダルのジョイント空間に基づくスタイル合成に関する研究
マルチカテゴリシナリオにおけるスタイル合成の能力を向上させるために,BatStylerという手法を提案する。
- 参考スコア(独自算出の注目度): 39.7856695215463
- License:
- Abstract: Source-Free Domain Generalization (SFDG) aims to develop a model that performs on unseen domains without relying on any source domains. However, the implementation remains constrained due to the unavailability of training data. Research on SFDG focus on knowledge transfer of multi-modal models and style synthesis based on joint space of multiple modalities, thus eliminating the dependency on source domain images. However, existing works primarily work for multi-domain and less-category configuration, but performance on multi-domain and multi-category configuration is relatively poor. In addition, the efficiency of style synthesis also deteriorates in multi-category scenarios. How to efficiently synthesize sufficiently diverse data and apply it to multi-category configuration is a direction with greater practical value. In this paper, we propose a method called BatStyler, which is utilized to improve the capability of style synthesis in multi-category scenarios. BatStyler consists of two modules: Coarse Semantic Generation and Uniform Style Generation modules. The Coarse Semantic Generation module extracts coarse-grained semantics to prevent the compression of space for style diversity learning in multi-category configuration, while the Uniform Style Generation module provides a template of styles that are uniformly distributed in space and implements parallel training. Extensive experiments demonstrate that our method exhibits comparable performance on less-category datasets, while surpassing state-of-the-art methods on multi-category datasets.
- Abstract(参考訳): Source-Free Domain Generalization (SFDG) は、ソースドメインに頼ることなく、目に見えないドメインで実行するモデルを開発することを目的としている。
しかし、トレーニングデータの有効性のため、実装には制約が残されている。
SFDGの研究は、マルチモーダルモデルの知識伝達と複数モーダルのジョイント空間に基づくスタイル合成に着目し、ソース領域画像への依存を排除している。
しかし、既存の作業は、主にマルチドメインと少ないカテゴリ構成で動作するが、マルチドメインとマルチカテゴリ構成のパフォーマンスは、比較的貧弱である。
さらに,多カテゴリーシナリオにおいてもスタイル合成の効率が低下する。
十分に多様なデータを効率的に合成し、それを多カテゴリ構成に適用する方法は、実用価値の高い方向である。
本稿では,マルチカテゴリシナリオにおけるスタイル合成の能力を向上させるために,BatStylerという手法を提案する。
BatStylerはCoarse Semantic GenerationとUniform Style Generationの2つのモジュールで構成されている。
粗いセマンティックジェネレーションモジュールは、多カテゴリ構成におけるスタイル多様性学習のための空間の圧縮を防ぐために粗い粒度のセマンティクスを抽出する一方、統一スタイルジェネレーションモジュールは、一様に空間に分散して並列トレーニングを実装するスタイルのテンプレートを提供する。
大規模な実験により,本手法は,マルチカテゴリデータセットの最先端手法を超越しながら,より少ないカテゴリデータセットに対して同等の性能を示すことが示された。
関連論文リスト
- DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization [43.67213274161226]
Source-Free Domain Generalization (SFDG) は、ソースドメインに頼ることなく、未確認のターゲットドメインに対して機能するモデルを開発することを目的としている。
SFDGにおける研究は、主に大規模視覚言語モデルの既存の知識に大きく依存している。
本稿では,動的PromptStyler(DPStyler)について紹介する。
論文 参考訳(メタデータ) (2024-03-25T12:31:01Z) - DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.14798033899955]
大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文 参考訳(メタデータ) (2023-12-05T18:34:12Z) - Multi-Domain Long-Tailed Learning by Augmenting Disentangled
Representations [80.76164484820818]
多くの現実世界の分類問題には、避けられない長い尾のクラスバランスの問題がある。
本稿では,この多領域長鎖学習問題について検討し,すべてのクラスとドメインにまたがってよく一般化されたモデルを作成することを目的とする。
TALLYは、選択的均衡サンプリング戦略に基づいて、ある例のセマンティック表現と別の例のドメイン関連ニュアンスを混合することでこれを達成している。
論文 参考訳(メタデータ) (2022-10-25T21:54:26Z) - Style Interleaved Learning for Generalizable Person Re-identification [69.03539634477637]
DG ReIDトレーニングのための新しいスタイルインターリーブラーニング(IL)フレームワークを提案する。
従来の学習戦略とは異なり、ILには2つの前方伝播と1つの後方伝播が組み込まれている。
我々のモデルはDG ReIDの大規模ベンチマークにおいて最先端の手法を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2022-07-07T07:41:32Z) - Low Resource Style Transfer via Domain Adaptive Meta Learning [30.323491061441857]
本稿では,DAMLとATMの2つの部分からなるDAML-ATM(Domain Adaptive Meta-Learning with Adversarial Transfer Model)を提案する。
DAMLは、複数の異種ソースドメインで一般的な知識を学ぶためのドメイン適応型メタラーニングアプローチであり、少量のデータで新しい未知のドメインに適応することができる。
また,非教師付きTSTアプローチであるAdversarial Transfer Model (ATM)を提案する。
論文 参考訳(メタデータ) (2022-05-25T03:58:24Z) - Distribution Aligned Multimodal and Multi-Domain Image Stylization [76.74823384524814]
マルチモーダルおよびマルチドメインスタイル転送のための統一フレームワークを提案する。
提案手法の鍵となるコンポーネントは,新しいスタイル分布アライメントモジュールである。
我々は,様々な芸術様式やジャンルで絵画の様式を伝達する枠組みを検証した。
論文 参考訳(メタデータ) (2020-06-02T07:25:53Z) - Unsupervised multi-modal Styled Content Generation [61.040392094140245]
UMMGANは、教師なし方式でマルチモーダル分布をモデル化するために設計された新しいアーキテクチャである。
UMMGANはモードとスタイルを効果的に切り離し、生成したコンテンツに対して独立した制御を行うことができることを示す。
論文 参考訳(メタデータ) (2020-01-10T19:36:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。