論文の概要: Frequency-Enhanced Dual-Subspace Networks for Few-Shot Fine-Grained Image Classification
- arxiv url: http://arxiv.org/abs/2604.14958v1
- Date: Thu, 16 Apr 2026 12:54:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.900118
- Title: Frequency-Enhanced Dual-Subspace Networks for Few-Shot Fine-Grained Image Classification
- Title(参考訳): Few-Shot Fine-Grained Image Classificationのための周波数拡張デュアルサブスペースネットワーク
- Authors: Meijia Wang, Guochao Wang, Haozhen Chu, Bin Yao, Weichuan Zhang, Yuan Wang, Junpo Yang,
- Abstract要約: 微粒化の少ない画像分類は,注釈付きサンプルの限られた数だけを用いて,視覚的類似度の高いサブカテゴリを認識することを目的としている。
既存のメトリック学習ベースの手法は、通常、空間的領域の特徴のみに依存する。
本稿では、周波数拡張デュアルサブスペースネットワーク(FEDSNet)を提案する。
- 参考スコア(独自算出の注目度): 6.738210148449625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot fine-grained image classification aims to recognize subcategories with high visual similarity using only a limited number of annotated samples. Existing metric learning-based methods typically rely solely on spatial domain features. Confined to this single perspective, models inevitably suffer from inherent texture biases, entangling essential structural details with high-frequency background noise. Furthermore, lacking cross-view geometric constraints, single-view metrics tend to overfit this noise, resulting in structural instability under few-shot conditions. To address these issues, this paper proposes the Frequency-Enhanced Dual-Subspace Network (FEDSNet). Specifically, FEDSNet utilizes the Discrete Cosine Transform (DCT) and a low-pass filtering mechanism to explicitly isolate low-frequency global structural components from spatial features, thereby suppressing background interference. Truncated Singular Value Decomposition (SVD) is employed to construct independent, low-rank linear subspaces for both spatial texture and frequency structural features. An adaptive gating mechanism is designed to dynamically fuse the projection distances from these dual views. This strategy leverages the structural stability of the frequency subspace to prevent the spatial subspace from overfitting to background features. Extensive experiments on four benchmark datasets - CUB-200-2011, Stanford Cars, Stanford Dogs, and FGVC-Aircraft - demonstrate that FEDSNet exhibits excellent classification performance and robustness, achieving highly competitive results compared to existing metric learning algorithms. Complexity analysis further confirms that the proposed network achieves a favorable balance between high accuracy and computational efficiency, providing an effective new paradigm for few-shot fine-grained visual recognition.
- Abstract(参考訳): 微粒化の少ない画像分類は,注釈付きサンプルの限られた数だけを用いて,視覚的類似度の高いサブカテゴリを認識することを目的としている。
既存のメトリック学習ベースの手法は、通常、空間的領域の特徴のみに依存する。
この単一視点で見ると、モデルは必然的に固有のテクスチャバイアスに悩まされ、構造的な詳細を高周波の背景ノイズと混同する。
さらに、クロスビュー幾何学的制約が欠如しているため、単一ビューのメトリクスはこのノイズに過度に適応し、少数ショット条件下での構造不安定が生じる。
これらの課題に対処するために、周波数拡張デュアルサブスペースネットワーク(FEDSNet)を提案する。
具体的には、離散コサイン変換(DCT)と低域フィルタ機構を用いて、空間的特徴から低周波グローバル構造成分を明示的に分離し、背景干渉を抑制する。
連続特異値分解(SVD)は、空間テクスチャと周波数構造の特徴の両方を独立して低ランクな線形部分空間を構築するために用いられる。
適応ゲーティング機構は、これらの双対ビューから射影距離を動的に融合させるように設計されている。
この戦略は、周波数部分空間の構造安定性を活用し、空間部分空間が背景特性に過度に収まらないようにする。
CUB-200-2011、Stanford Cars、Stanford Dogs、FGVC-Aircraftの4つのベンチマークデータセットに対する大規模な実験は、FEDSNetが優れた分類性能と堅牢性を示し、既存のメトリック学習アルゴリズムと比較して高い競争力を発揮することを示した。
複雑度解析により,提案するネットワークは精度と計算効率のバランスが良好であることが確認された。
関連論文リスト
- FSDETR: Frequency-Spatial Feature Enhancement for Small Object Detection [1.5054442506653827]
小型オブジェクト検出は、ダウンサンプリングによる特徴劣化のため、依然として重要な課題である。
本稿では,RT-DETRベースライン上に構築された周波数空間特徴強調フレームワークFSDETRを提案する。
FSDETRのパラメータはわずか14.7Mであり、VisDrone 2019では13.9%、TinyPersonでは48.95%である。
論文 参考訳(メタデータ) (2026-04-16T11:22:13Z) - Towards Frequency-Adaptive Learning for SAR Despeckling [10.764049665817629]
分割・分散アーキテクチャに基づく周波数適応型ヘテロジニアスデスペクリングモデルを提案する。
ノイズ特性の異なるサブネットワークを設計し,周波数成分の異なるサブネットワークを設計する。
エッジやテクスチャに富んだ高周波サブバンドに対して,ノイズ抑制と機能強化のための変形可能な畳み込みを備えた拡張U-Netを導入する。
論文 参考訳(メタデータ) (2025-11-08T07:08:22Z) - Beyond Frequency: Seeing Subtle Cues Through the Lens of Spatial Decomposition for Fine-Grained Visual Classification [8.936378000130812]
本稿では,空間領域における低レベル細部および高レベル意味論の表現能力を適応的に向上する Subtle-Cue Oriented Perception Engine (SCOPE) を提案する。
SCOPEは4つの一般的なきめ細かい画像分類ベンチマークで新しい最先端を実現する。
論文 参考訳(メタデータ) (2025-08-09T12:13:40Z) - Hyperspectral Image Classification via Transformer-based Spectral-Spatial Attention Decoupling and Adaptive Gating [12.168520751389622]
ディープニューラルネットワークは、ハイパースペクトル画像分類においていくつかの課題に直面している。
本稿ではSTNetと呼ばれる新しいネットワークアーキテクチャを提案する。
提案手法は、IN, UP, KSCデータセット上での優れた性能を示し、主流のハイパースペクトル画像分類手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-06-10T01:24:35Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Coarse-Fine Spectral-Aware Deformable Convolution For Hyperspectral Image Reconstruction [15.537910100051866]
Coded Aperture Snapshot Spectral Imaging (CASSI) の逆問題について検討する。
粗面スペクトル対応変形性畳み込みネットワーク(CFSDCN)を提案する。
我々のCFSDCNは、シミュレーションされたHSIデータセットと実際のHSIデータセットの両方において、従来の最先端(SOTA)メソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-06-18T15:15:12Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。