論文の概要: Spatial frequency information fusion network for few-shot learning
- arxiv url: http://arxiv.org/abs/2506.18364v1
- Date: Mon, 23 Jun 2025 07:47:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.894746
- Title: Spatial frequency information fusion network for few-shot learning
- Title(参考訳): 数ショット学習のための空間周波数情報融合ネットワーク
- Authors: Wenqing Zhao, Guojia Xie, Han Pan, Biao Yang, Weichuan Zhang,
- Abstract要約: 本稿では,革新的なデータ前処理機能を備えたSFIFNetを提案する。
この手法の鍵は、周波数領域情報と空間領域情報を統合することにより、画像特徴表現の精度を高めることである。
- 参考スコア(独自算出の注目度): 7.79100197855517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of Few-shot learning is to fully leverage the limited data resources for exploring the latent correlations within the data by applying algorithms and training a model with outstanding performance that can adequately meet the demands of practical applications. In practical applications, the number of images in each category is usually less than that in traditional deep learning, which can lead to over-fitting and poor generalization performance. Currently, many Few-shot classification models pay more attention to spatial domain information while neglecting frequency domain information, which contains more feature information. Ignoring frequency domain information will prevent the model from fully exploiting feature information, which would effect the classification performance. Based on conventional data augmentation, this paper proposes an SFIFNet with innovative data preprocessing. The key of this method is enhancing the accuracy of image feature representation by integrating frequency domain information with spatial domain information. The experimental results demonstrate the effectiveness of this method in enhancing classification performance.
- Abstract(参考訳): Few-shot Learningの目的は、アルゴリズムを適用し、実用的なアプリケーションの要求を適切に満たせる優れた性能を持つモデルを訓練することによって、データ内の潜伏相関を探索するために、限られたデータリソースを完全に活用することである。
実践的な応用では、各カテゴリのイメージ数は従来のディープラーニングよりも少なくなり、過度に適合し、一般化性能が低下する可能性がある。
現在、多くのFew-shot分類モデルは、より多くの特徴情報を含む周波数領域情報を無視しながら、空間領域情報により多くの注意を払っている。
周波数領域情報の無視は、モデルが特徴情報を完全に活用することを防ぎ、分類性能に影響を及ぼす。
本稿では、従来のデータ拡張に基づいて、革新的なデータ前処理を備えたSFIFNetを提案する。
この手法の鍵は、周波数領域情報と空間領域情報を統合することにより、画像特徴表現の精度を高めることである。
実験により, 分類性能の向上に本手法の有効性が示された。
関連論文リスト
- FreRA: A Frequency-Refined Augmentation for Contrastive Learning on Time Series Classification [56.925103708982164]
周波数領域からの新たな視点を示し、ダウンストリーム分類の利点として、グローバル、独立、コンパクトの3つを識別する。
本稿では,分類タスクにおける時系列のコントラスト学習に適した,軽量で効果的な周波数補充拡張(FreRA)を提案する。
FreRAは、時系列分類、異常検出、転送学習タスクにおいて、常に10つの主要なベースラインを上回ります。
論文 参考訳(メタデータ) (2025-05-29T07:18:28Z) - CSTA: Spatial-Temporal Causal Adaptive Learning for Exemplar-Free Video Class-Incremental Learning [62.69917996026769]
クラスインクリメンタルな学習課題は、空間的外観と時間的行動の関与の両方を学習し、保存することを必要とする。
本稿では,各クラス固有のインクリメンタル情報要件を調整し,新しいクラスパターンを学習するためのアダプタを分離するフレームワークを提案する。
異なる種類の情報間のインクリメントと記憶の衝突を減らすために,因果補償機構を提案する。
論文 参考訳(メタデータ) (2025-01-13T11:34:55Z) - Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.78498670529746]
抽出した特徴量の均等分布を保証するために正規化手法を導入する。
その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文 参考訳(メタデータ) (2024-09-03T07:32:46Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Few-Shot Learning by Integrating Spatial and Frequency Representation [25.11147383752403]
本稿では,システムの識別能力を高めるために,周波数情報を学習モデルに統合することを提案する。
周波数表現を生成するために離散コサイン変換(dct)を用い,その特徴を空間領域と周波数領域の両方から統合して分類する。
論文 参考訳(メタデータ) (2021-05-11T21:44:31Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - Mutual Information-based Disentangled Neural Networks for Classifying
Unseen Categories in Different Domains: Application to Fetal Ultrasound
Imaging [10.504733425082335]
ディープニューラルネットワークは、異なる絡み合ったドメイン特徴とカテゴリ特徴を持つ画像間の限定的な一般化性を示す。
本稿では,MIDNet(Multual Information-based Disentangled Neural Networks)を提案する。
2つの異なる画像分類タスクのための胎児超音波データセットについて,提案手法を広範囲に評価した。
論文 参考訳(メタデータ) (2020-10-30T17:32:18Z) - Fine-Grain Few-Shot Vision via Domain Knowledge as Hyperspherical Priors [79.22051549519989]
プロトタイプネットワークは、コンピュータビジョンにおいて、数ショットの学習タスクでうまく機能することが示されている。
ドメイン知識を情報的先行要素として取り入れつつ,クラスを最大限に分離することで,数発の微粒化を実現する方法を示す。
論文 参考訳(メタデータ) (2020-05-23T02:10:57Z) - Learning Cross-domain Generalizable Features by Representation
Disentanglement [11.74643883335152]
ディープラーニングモデルは、異なるドメイン間で限定的な一般化性を示す。
本稿では,MIDNet(Multual-Information-based Disentangled Neural Networks)を提案する。
本手法は手書き桁データセットと胎児超音波データセットを用いて画像分類を行う。
論文 参考訳(メタデータ) (2020-02-29T17:53:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。