論文の概要: Learning Fine-grained Domain Generalization via Hyperbolic State Space Hallucination
- arxiv url: http://arxiv.org/abs/2504.08020v1
- Date: Thu, 10 Apr 2025 17:30:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:20:04.258221
- Title: Learning Fine-grained Domain Generalization via Hyperbolic State Space Hallucination
- Title(参考訳): 双曲状態空間幻覚によるきめ細かい領域一般化の学習
- Authors: Qi Bi, Jingjun Yi, Haolan Zhan, Wei Ji, Gui-Song Xia,
- Abstract要約: きめ細かいドメイン一般化(FGDG)は、未確認のターゲットドメインに十分に一般化可能なきめ細かい表現を学習することを目的としている。
本稿では,ハイパボリック・ステート・スペース・ハロシン化法(HSSH)を提案する。
3つのFGDGベンチマークの実験は、最先端のパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 39.0240397696825
- License:
- Abstract: Fine-grained domain generalization (FGDG) aims to learn a fine-grained representation that can be well generalized to unseen target domains when only trained on the source domain data. Compared with generic domain generalization, FGDG is particularly challenging in that the fine-grained category can be only discerned by some subtle and tiny patterns. Such patterns are particularly fragile under the cross-domain style shifts caused by illumination, color and etc. To push this frontier, this paper presents a novel Hyperbolic State Space Hallucination (HSSH) method. It consists of two key components, namely, state space hallucination (SSH) and hyperbolic manifold consistency (HMC). SSH enriches the style diversity for the state embeddings by firstly extrapolating and then hallucinating the source images. Then, the pre- and post- style hallucinate state embeddings are projected into the hyperbolic manifold. The hyperbolic state space models the high-order statistics, and allows a better discernment of the fine-grained patterns. Finally, the hyperbolic distance is minimized, so that the impact of style variation on fine-grained patterns can be eliminated. Experiments on three FGDG benchmarks demonstrate its state-of-the-art performance.
- Abstract(参考訳): きめ細かいドメイン一般化(FGDG)は、ソースドメインデータのみをトレーニングした場合に、未確認のターゲットドメインに適切に一般化できる、きめ細かい表現を学習することを目的としている。
一般領域の一般化と比較すると、FGDGは細粒度圏が微妙で小さなパターンでしか識別できないという点において特に困難である。
このようなパターンは、照明や色などによって引き起こされるクロスドメインスタイルのシフトの下では、特に脆弱である。
本稿では,このフロンティアを推し進めるために,新しいハイパーボリック・ステート・スペース・ハロシン化法(HSSH)を提案する。
状態空間幻覚(SSH)と双曲多様体整合(HMC)という2つの重要な成分から構成される。
SSHは、まずソースイメージを外挿し、幻覚することにより、状態埋め込みのスタイルの多様性を豊かにする。
そして、前および後スタイルの幻覚状態埋め込みを双曲多様体に投影する。
双曲状態空間は高次統計をモデル化し、きめ細かいパターンをよりよく識別することができる。
最後に、双曲距離を最小化することにより、細粒度パターンに対するスタイル変動の影響を排除できる。
3つのFGDGベンチマークの実験は、最先端のパフォーマンスを示している。
関連論文リスト
- DGMamba: Domain Generalization via Generalized State Space Model [80.82253601531164]
ドメイン一般化(DG)は、様々な場面における分散シフト問題を解決することを目的としている。
Mambaは、新興状態空間モデル(SSM)として、より優れた線形複雑性と大域的受容場を持つ。
本稿では,DGMamba という新たな DG フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-11T14:35:59Z) - DiffMAC: Diffusion Manifold Hallucination Correction for High Generalization Blind Face Restoration [62.44659039265439]
視覚障害者の視力回復を支援するための拡散情報拡散フレームワークを提案する。
DiffMACは、多種多様な劣化シーンと異種ドメインにおいて、高度な顔の復元を実現する。
結果は,最先端手法よりもDiffMACの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-15T08:44:15Z) - Dual Stage Stylization Modulation for Domain Generalized Semantic
Segmentation [39.35385886870209]
In the Adversarial Semantic Hallucination+ framework。
本手法は,各画素に対する意味情報を活用することにより,画素単位の幻覚強度を適応的に調整する。
提案手法の有効性を,公開されているセマンティックセグメンテーションベンチマークデータセットの総合的な実験により検証する。
論文 参考訳(メタデータ) (2023-04-18T23:54:20Z) - FFHR: Fully and Flexible Hyperbolic Representation for Knowledge Graph
Completion [45.470475498688344]
双曲空間におけるいくつかの重要な操作は、まだ良い定義を欠いているため、既存の方法では双曲空間の利点を十分に活用できない。
我々は,近年のユークリッド対応の進歩を双曲空間に転送できるtextbfFully と textbfFlexible textbfHyperbolic textbfRepresentation フレームワーク (textbfFFHR) を開発した。
論文 参考訳(メタデータ) (2023-02-07T14:50:28Z) - Style-Hallucinated Dual Consistency Learning: A Unified Framework for
Visual Domain Generalization [113.03189252044773]
本稿では,様々な視覚的タスクにおけるドメインシフトを処理するための統合フレームワークであるStyle-HAllucinated Dual consistEncy Learning (SHADE)を提案する。
我々の汎用SHADEは、画像分類、セマンティックセグメンテーション、オブジェクト検出など、様々な視覚認識タスクにおける一般化を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-12-18T11:42:51Z) - Enhancing Hyperbolic Graph Embeddings via Contrastive Learning [7.901082408569372]
複数の双曲空間を通してノード表現を学習する新しいハイパーボリックグラフコントラスト学習(HGCL)フレームワークを提案する。
複数の実世界のデータセットに対する実験結果は、提案したHGCLの優位性を示している。
論文 参考訳(メタデータ) (2022-01-21T06:10:05Z) - Generalization Error Bound for Hyperbolic Ordinal Embedding [21.320308755965748]
双曲的順序埋め込み(英: hyperbolic Ordinal embedded, HOE)は、双曲空間の点としての実体を表す。
埋め込み空間の半径に対して最も指数関数的なHOEの一般化誤差を初めて与える。
HOEとユークリッド順序埋め込みの境界の比較は、HOEの一般化誤差がその指数表現能力のコストとして妥当であることを示している。
論文 参考訳(メタデータ) (2021-05-21T17:31:08Z) - Sparse Graphical Memory for Robust Planning [93.39298821537197]
スパースメモリに状態と実現可能な遷移を格納する新しいデータ構造であるスパースグラフィカルメモリ(SGM)を導入する。
SGMは、ゴール条件付きRLに古典的状態集約基準を適用し、新しい双方向整合目標に従って状態を集約する。
本研究では, SGM が, 遠近法, スパース・リワード視覚ナビゲーションタスクにおいて, 最先端の工法を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-03-13T17:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。