論文の概要: FOUND: Fourier-based von Mises Distribution for Robust Single Domain Generalization in Object Detection
- arxiv url: http://arxiv.org/abs/2511.10352v1
- Date: Fri, 14 Nov 2025 01:46:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.82318
- Title: FOUND: Fourier-based von Mises Distribution for Robust Single Domain Generalization in Object Detection
- Title(参考訳): FOUND:オブジェクト検出におけるロバスト単一領域一般化のためのフーリエベースvon Mises分布
- Authors: Mengzhu Wang, Changyuan Deng, Shanshan Wang, Nan Yin, Long Lan, Liang Yang,
- Abstract要約: オブジェクト検出のための単一ドメインの一般化は、対象ドメインに効果的に一般化できる単一のソースドメイン上でモデルをトレーニングすることを目的としている。
本稿では、von Mises-Fisher(vMF)分布とフーリエ変換をCLIP誘導パイプラインに統合することにより、オブジェクト検出を強化する新しいフレームワークを提案する。
提案手法はCLIPのセマンティックアライメントの利点を保全するだけでなく,機能多様性とドメイン間の構造的整合性も強化する。
- 参考スコア(独自算出の注目度): 46.14695068852788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single Domain Generalization (SDG) for object detection aims to train a model on a single source domain that can generalize effectively to unseen target domains. While recent methods like CLIP-based semantic augmentation have shown promise, they often overlook the underlying structure of feature distributions and frequency-domain characteristics that are critical for robustness. In this paper, we propose a novel framework that enhances SDG object detection by integrating the von Mises-Fisher (vMF) distribution and Fourier transformation into a CLIP-guided pipeline. Specifically, we model the directional features of object representations using vMF to better capture domain-invariant semantic structures in the embedding space. Additionally, we introduce a Fourier-based augmentation strategy that perturbs amplitude and phase components to simulate domain shifts in the frequency domain, further improving feature robustness. Our method not only preserves the semantic alignment benefits of CLIP but also enriches feature diversity and structural consistency across domains. Extensive experiments on the diverse weather-driving benchmark demonstrate that our approach outperforms the existing state-of-the-art method.
- Abstract(参考訳): オブジェクト検出のための単一ドメイン一般化(SDG)は、対象ドメインに効果的に一般化できる単一のソースドメイン上でモデルをトレーニングすることを目的としている。
CLIPベースのセマンティック拡張のような最近の手法は、将来性を示しているが、機能分散の基盤構造や、堅牢性に不可欠な周波数領域の特徴を見落としていることが多い。
本稿では、von Mises-Fisher(vMF)分布とフーリエ変換をCLIP誘導パイプラインに統合することにより、SDGオブジェクト検出を強化する新しいフレームワークを提案する。
具体的には、オブジェクト表現の方向性をvMFを用いてモデル化し、埋め込み空間におけるドメイン不変セマンティック構造をよりよくキャプチャする。
さらに、周波数領域における領域シフトをシミュレートするために振幅と位相成分を摂動するフーリエに基づく拡張戦略を導入し、特徴の堅牢性をさらに向上する。
提案手法は,CLIPのセマンティックアライメントの利点を保全するだけでなく,機能多様性とドメイン間の構造的整合性も強化する。
多様な気象予報ベンチマークに関する大規模な実験により、我々のアプローチは既存の最先端手法よりも優れていることが示された。
関連論文リスト
- Style-Adaptive Detection Transformer for Single-Source Domain Generalized Object Detection [7.768332621617199]
単一ソースドメインの一般化は、未確認のターゲットドメインによく一般化するソースドメインデータのみを使用して検出器を開発することを目的としている。
既存の手法は主にCNNベースで、データ拡張と機能アライメントを組み合わせることで堅牢性を向上させる。
単一ソース領域の一般化に適したDTRベースの検出器であるStyle-Adaptive Detection TRansformer (SA-DETR)を提案する。
論文 参考訳(メタデータ) (2025-04-29T07:38:37Z) - Let Synthetic Data Shine: Domain Reassembly and Soft-Fusion for Single Domain Generalization [68.41367635546183]
単一ドメインの一般化は、単一のソースからのデータを使用して、さまざまなシナリオで一貫したパフォーマンスでモデルをトレーニングすることを目的としている。
モデル一般化を改善するために合成データを活用した学習フレームワークDRSFを提案する。
論文 参考訳(メタデータ) (2025-03-17T18:08:03Z) - Integrating Frequency Guidance into Multi-source Domain Generalization for Bearing Fault Diagnosis [24.85752780864944]
本稿では,FARNetというFourierベースのAugmentation Restruction Networkを提案する。
本発明のネットワークは、振幅スペクトルサブネットワークと位相スペクトルサブネットワークとから構成され、ソースドメインとターゲットドメインとの相違を順次低減する。
モデル出力の決定境界を従来の三重項損失と比較して洗練するために,一般化に寄与する多様体三重項損失を提案する。
論文 参考訳(メタデータ) (2025-02-01T20:23:03Z) - Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。
データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文 参考訳(メタデータ) (2024-06-01T02:41:34Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。