論文の概要: DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization
- arxiv url: http://arxiv.org/abs/2504.08019v1
- Date: Thu, 10 Apr 2025 17:24:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:20:04.768989
- Title: DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization
- Title(参考訳): DGFamba:ビジュアルドメインの一般化のためのフローファクトリ化された状態空間
- Authors: Qi Bi, Jingjun Yi, Hao Zheng, Haolan Zhan, Wei Ji, Yawen Huang, Yuexiang Li,
- Abstract要約: 視覚領域一般化のための新しいフローファクトリズステートスペースモデルDG-Fambaを提案する。
ドメインの整合性を維持するために,フローの分解によるスタイル拡張と元の状態の埋め込みを革新的にマッピングする。
様々な視覚領域の一般化設定で行われた実験は、その最先端性能を示している。
- 参考スコア(独自算出の注目度): 27.903842187045118
- License:
- Abstract: Domain generalization aims to learn a representation from the source domain, which can be generalized to arbitrary unseen target domains. A fundamental challenge for visual domain generalization is the domain gap caused by the dramatic style variation whereas the image content is stable. The realm of selective state space, exemplified by VMamba, demonstrates its global receptive field in representing the content. However, the way exploiting the domain-invariant property for selective state space is rarely explored. In this paper, we propose a novel Flow Factorized State Space model, dubbed as DG-Famba, for visual domain generalization. To maintain domain consistency, we innovatively map the style-augmented and the original state embeddings by flow factorization. In this latent flow space, each state embedding from a certain style is specified by a latent probability path. By aligning these probability paths in the latent space, the state embeddings are able to represent the same content distribution regardless of the style differences. Extensive experiments conducted on various visual domain generalization settings show its state-of-the-art performance.
- Abstract(参考訳): ドメインの一般化は、ソースドメインから表現を学ぶことを目的としており、任意の未知のターゲットドメインに一般化することができる。
視覚領域の一般化の根本的な課題は、画像内容が安定であるのに対して、劇的なスタイルの変化によって引き起こされる領域ギャップである。
VMambaが例示した選択状態空間の領域は、そのコンテンツを表現するためのグローバルな受容場を示している。
しかし、選択状態空間に対する領域不変性を利用する方法はめったに研究されていない。
本稿では,視覚領域の一般化のための新しいフローファクトリズステートスペースモデルDG-Fambaを提案する。
ドメインの整合性を維持するために,フローの分解によるスタイル拡張と元の状態の埋め込みを革新的にマッピングする。
この潜水流空間では、あるスタイルから埋め込まれた各状態が潜水確率経路によって特定される。
これらの確率パスを潜在空間に整列させることで、状態埋め込みはスタイルの違いにかかわらず、同じコンテンツ分布を表現できる。
様々な視覚領域の一般化設定で行われた大規模な実験は、その最先端性能を示している。
関連論文リスト
- StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。
データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文 参考訳(メタデータ) (2024-06-01T02:41:34Z) - DomainDrop: Suppressing Domain-Sensitive Channels for Domain
Generalization [25.940491294232956]
DomainDropは、チャンネルの堅牢性をドメインシフトに継続的に拡張するフレームワークである。
我々のフレームワークは、他の競合する手法と比較して最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-08-20T14:48:52Z) - Single Domain Dynamic Generalization for Iris Presentation Attack
Detection [41.126916126040655]
アイリスプレゼンテーションの一般化はドメイン内の設定では大きな成功を収めたが、目に見えないドメインでは容易に分解できる。
本稿では,ドメイン不変性とドメイン固有性を利用した単一ドメイン動的一般化(SDDG)フレームワークを提案する。
提案手法は有効であり,LivDet-Iris 2017データセットの最先端性を上回っている。
論文 参考訳(メタデータ) (2023-05-22T07:54:13Z) - Instance-Aware Domain Generalization for Face Anti-Spoofing [42.36157210235893]
Face Anti-Spoofing (FAS) は、最近、目に見えないシナリオの一般化を改善するために研究されている。
従来の手法では、各ドメインの分布を整列してドメイン不変表現を学習するためにドメインラベルに依存していた。
ドメインラベルを必要とせずに、インスタンスレベルで機能を整列するDG FASの新しい視点を提案する。
論文 参考訳(メタデータ) (2023-04-12T06:41:16Z) - Rethinking Domain Generalization for Face Anti-spoofing: Separability
and Alignment [35.67771212285966]
本研究は,画像の解像度,ぼやけ度,センサの変動といった領域ギャップに対する対面アンチ・スプーフィング(FAS)モデルの一般化問題について検討する。
我々は、不変リスク最小化(IRM)の問題として、分離性と整合性(SA-FAS)のこのFAS戦略を定式化する。
ドメイン間FASデータセットに対するSA-FASの有効性を実証し、最先端の性能を確立する。
論文 参考訳(メタデータ) (2023-03-23T20:34:27Z) - Normalization Perturbation: A Simple Domain Generalization Method for
Real-World Domain Shifts [133.99270341855728]
実世界のドメインスタイルは環境の変化やセンサノイズによって大きく変化する可能性がある。
深層モデルはトレーニングドメインスタイルしか知らない。
このドメインスタイルのオーバーフィット問題を解決するために,正規化摂動を提案する。
論文 参考訳(メタデータ) (2022-11-08T17:36:49Z) - Semantic-Aware Domain Generalized Segmentation [67.49163582961877]
ソースドメインでトレーニングされたディープモデルは、異なるデータ分布を持つ未確認対象ドメインで評価された場合、一般化に欠ける。
セマンティック・アウェア・正規化(SAN)とセマンティック・アウェア・ホワイトニング(SAW)の2つの新しいモジュールを含むフレームワークを提案する。
提案手法は,様々なバックボーンネットワークにおいて,既存の最先端ネットワークよりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-04-02T09:09:59Z) - Domain Generalization via Shuffled Style Assembly for Face Anti-Spoofing [69.80851569594924]
FAS(Generalizable Face Anti-Spoofing)は注目されている。
この作業では、完全な表現をコンテンツとスタイルに分けます。
Shuffled Style Assembly Network (SSAN) は、異なるコンテンツやスタイルの特徴を抽出し、再組み立てするために提案されている。
論文 参考訳(メタデータ) (2022-03-10T12:44:05Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Batch Normalization Embeddings for Deep Domain Generalization [50.51405390150066]
ドメインの一般化は、異なるドメインと見えないドメインで堅牢に実行されるように機械学習モデルをトレーニングすることを目的としている。
一般的な領域一般化ベンチマークにおいて,最先端技術よりも分類精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-11-25T12:02:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。