論文の概要: FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning
- arxiv url: http://arxiv.org/abs/2505.08349v1
- Date: Tue, 13 May 2025 08:48:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-14 20:57:54.490911
- Title: FAD: Frequency Adaptation and Diversion for Cross-domain Few-shot Learning
- Title(参考訳): FAD:クロスドメイン・ファウショット学習のための周波数適応とディバージョン
- Authors: Ruixiao Shi, Fu Feng, Yucheng Xie, Jing Wang, Xin Geng,
- Abstract要約: ドメイン間数ショット学習では、大きな分散シフトの下で限定ラベル付きサンプルからモデルを一般化する必要がある。
本稿では、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を紹介する。
FADは、目に見えないドメインと見えないドメインの両方において、最先端のメソッドを一貫して上回っている。
- 参考スコア(独自算出の注目度): 35.40065954148091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain few-shot learning (CD-FSL) requires models to generalize from limited labeled samples under significant distribution shifts. While recent methods enhance adaptability through lightweight task-specific modules, they operate solely in the spatial domain and overlook frequency-specific variations that are often critical for robust transfer. We observe that spatially similar images across domains can differ substantially in their spectral representations, with low and high frequencies capturing complementary semantic information at coarse and fine levels. This indicates that uniform spatial adaptation may overlook these spectral distinctions, thus constraining generalization. To address this, we introduce Frequency Adaptation and Diversion (FAD), a frequency-aware framework that explicitly models and modulates spectral components. At its core is the Frequency Diversion Adapter, which transforms intermediate features into the frequency domain using the discrete Fourier transform (DFT), partitions them into low, mid, and high-frequency bands via radial masks, and reconstructs each band using inverse DFT (IDFT). Each frequency band is then adapted using a dedicated convolutional branch with a kernel size tailored to its spectral scale, enabling targeted and disentangled adaptation across frequencies. Extensive experiments on the Meta-Dataset benchmark demonstrate that FAD consistently outperforms state-of-the-art methods on both seen and unseen domains, validating the utility of frequency-domain representations and band-wise adaptation for improving generalization in CD-FSL.
- Abstract(参考訳): クロスドメイン・ショットラーニング (CD-FSL) では、限定されたラベル付きサンプルからかなりの分布シフトの下でモデルを一般化する必要がある。
最近の手法は、軽量なタスク固有モジュールによって適応性を高めるが、それらは空間領域のみで動作し、しばしばロバスト転送にとって重要な周波数固有のバリエーションを見落としている。
領域間の空間的に類似した画像はスペクトル表現において大きく異なっており、低周波・高周波が粗くきめ細かなレベルで相補的な意味情報を捉えている。
このことは、均一な空間適応がこれらのスペクトルの区別を無視し、一般化を制限していることを示している。
これを解決するために、スペクトル成分を明示的にモデル化・変調する周波数対応フレームワークである周波数適応・変換(FAD)を導入する。
中心となる周波数変換アダプタは、離散フーリエ変換(DFT)を用いて中間機能を周波数領域に変換し、ラジアルマスクを介して低、中、高周波帯域に分割し、逆DFT(IDFT)を用いて各バンドを再構成する。
それぞれの周波数帯域は、スペクトルスケールに合わせてカーネルサイズを調整した専用の畳み込み分岐を用いて適応され、周波数をまたいだターゲットおよびアンタングル適応が可能である。
Meta-Dataset ベンチマークの広範囲な実験により、FAD は目に見える領域と見えない領域の両方で最先端の手法を一貫して上回り、周波数領域表現とバンドワイド適応の有効性を検証し、CD-FSL の一般化を改善した。
関連論文リスト
- Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Frequency-Adaptive Dilated Convolution for Semantic Segmentation [14.066404173580864]
本稿では、スペクトル分析の観点から、拡張畳み込みの個々の位相を改善するための3つの戦略を提案する。
周波数適応型拡張畳み込み(FADC)を導入し、局所周波数成分に基づいて空間的に拡散率を調整する。
2つのプラグインモジュールを設計し、有効帯域幅と受容フィールドサイズを直接的に拡張する。
論文 参考訳(メタデータ) (2024-03-08T15:00:44Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - FAMLP: A Frequency-Aware MLP-Like Architecture For Domain Generalization [73.41395947275473]
本稿では、変換周波数領域において、ドメイン固有の特徴をフィルタリングする新しい周波数認識アーキテクチャを提案する。
3つのベンチマークの実験では、最先端の手法をそれぞれ3%、4%、9%のマージンで上回った。
論文 参考訳(メタデータ) (2022-03-24T07:26:29Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。