論文の概要: A novel spatial-frequency domain network for zero-shot incremental
learning
- arxiv url: http://arxiv.org/abs/2402.07216v1
- Date: Sun, 11 Feb 2024 14:24:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 16:56:03.057910
- Title: A novel spatial-frequency domain network for zero-shot incremental
learning
- Title(参考訳): ゼロショットインクリメンタル学習のための新しい空間周波数領域ネットワーク
- Authors: Jie Ren, Yang Zhao, Weichuan Zhang and Changming Sun
- Abstract要約: ゼロショットインクリメンタル学習は、学習済みのクラスを忘れずに、モデルを新しいクラスに一般化できるようにすることを目的としている。
既存のアルゴリズムでは、各サンプル画像領域から重要な情報を取得できず、モデルの分類性能を損なう。
本稿では、空間周波数特徴抽出(SFFE)モジュールと注意特徴調整(AFA)モジュールを含む新しい空間周波数領域ネットワーク(SFDNet)を提案する。
- 参考スコア(独自算出の注目度): 32.02542501871148
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot incremental learning aims to enable the model to generalize to new
classes without forgetting previously learned classes. However, the semantic
gap between old and new sample classes can lead to catastrophic forgetting.
Additionally, existing algorithms lack capturing significant information from
each sample image domain, impairing models' classification performance.
Therefore, this paper proposes a novel Spatial-Frequency Domain Network
(SFDNet) which contains a Spatial-Frequency Feature Extraction (SFFE) module
and Attention Feature Alignment (AFA) module to improve the Zero-Shot
Translation for Class Incremental algorithm. Firstly, SFFE module is designed
which contains a dual attention mechanism for obtaining salient
spatial-frequency feature information. Secondly, a novel feature fusion module
is conducted for obtaining fused spatial-frequency domain features. Thirdly,
the Nearest Class Mean classifier is utilized to select the most suitable
category. Finally, iteration between tasks is performed using the Zero-Shot
Translation model. The proposed SFDNet has the ability to effectively extract
spatial-frequency feature representation from input images, improve the
accuracy of image classification, and fundamentally alleviate catastrophic
forgetting. Extensive experiments on the CUB 200-2011 and CIFAR100 datasets
demonstrate that our proposed algorithm outperforms state-of-the-art
incremental learning algorithms.
- Abstract(参考訳): ゼロショットインクリメンタル学習は、モデルが学習したクラスを忘れずに新しいクラスに一般化できるようにすることを目的としている。
しかし、古いサンプルクラスと新しいサンプルクラスのセマンティックなギャップは、破滅的な忘れを招きかねない。
さらに、既存のアルゴリズムは各サンプル画像ドメインから重要な情報を取得できず、モデルの分類性能を損なう。
そこで本稿では,クラスインクリメンタルアルゴリズムのゼロショット翻訳を改善するために,空間周波数特徴抽出(SFFE)モジュールと注意特徴調整(AFA)モジュールを含む新しい空間周波数領域ネットワークを提案する。
まず、SFFEモジュールは、空間周波数情報を得るための二重注意機構を含むように設計されている。
次に、融合した空間周波数領域特徴を得るための新しい特徴融合モジュールを実行する。
第3に、最も近いクラス平均分類器を使用して最も適切なカテゴリを選択する。
最後に、ゼロショット翻訳モデルを用いてタスク間のイテレーションを行う。
提案するsfdnetは,入力画像から空間周波数特徴表現を効果的に抽出し,画像分類の精度を向上し,致命的な忘れを根本的に緩和する能力を有する。
CUB 200-2011 と CIFAR100 データセットの大規模な実験により,提案アルゴリズムが最先端の漸進学習アルゴリズムより優れていることが示された。
関連論文リスト
- Meta-Exploiting Frequency Prior for Cross-Domain Few-Shot Learning [86.99944014645322]
クロスドメインなFew-Shot学習のための新しいフレームワーク,Meta-Exploiting Frequency Priorを導入する。
各クエリ画像を高周波および低周波成分に分解し,特徴埋め込みネットワークに並列に組み込む。
本フレームワークは、複数のドメイン間数ショット学習ベンチマークにおいて、最先端の新たな結果を確立する。
論文 参考訳(メタデータ) (2024-11-03T04:02:35Z) - InfRS: Incremental Few-Shot Object Detection in Remote Sensing Images [11.916941756499435]
本稿では,リモートセンシング画像におけるインクリメンタルな数ショット物体検出の複雑な課題について検討する。
本稿では,新しい授業の漸進的な学習を促進するために,InfRSと呼ばれる先駆的な微調整技術を導入する。
我々はワッサーシュタイン距離に基づく原型校正戦略を開発し、破滅的な忘れ問題を軽減する。
論文 参考訳(メタデータ) (2024-05-18T13:39:50Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - Feature Selection using Sparse Adaptive Bottleneck Centroid-Encoder [1.2487990897680423]
2つ以上のクラスで識別される特徴を決定するために,新しい非線形モデル SABCE (Sparse Adaptive Bottleneckid-Encoder) を導入する。
このアルゴリズムは、高次元生物学的、画像、音声、加速度センサデータなど、様々な実世界のデータセットに適用される。
論文 参考訳(メタデータ) (2023-06-07T21:37:21Z) - FOSTER: Feature Boosting and Compression for Class-Incremental Learning [52.603520403933985]
ディープニューラルネットワークは、新しいカテゴリーを学ぶ際に破滅的な忘れ方に悩まされる。
本稿では,新たなカテゴリを適応的に学習するためのモデルとして,新しい2段階学習パラダイムFOSTERを提案する。
論文 参考訳(メタデータ) (2022-04-10T11:38:33Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - Pay Attention with Focus: A Novel Learning Scheme for Classification of
Whole Slide Images [8.416553728391309]
スライド画像全体(WSI)を解析するための新しい2段階アプローチを提案する。
まず、WSIから代表パッチ(モザイクと呼ばれる)を抽出する。
モザイクの各パッチは、ディープネットワークを用いて特徴ベクトルに符号化される。
第2段階では、WSIから符号化されたパッチレベルの一連の特徴を用いて、一次診断確率を算出する。
論文 参考訳(メタデータ) (2021-06-11T21:59:02Z) - Few-Shot Learning by Integrating Spatial and Frequency Representation [25.11147383752403]
本稿では,システムの識別能力を高めるために,周波数情報を学習モデルに統合することを提案する。
周波数表現を生成するために離散コサイン変換(dct)を用い,その特徴を空間領域と周波数領域の両方から統合して分類する。
論文 参考訳(メタデータ) (2021-05-11T21:44:31Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Frequency-aware Discriminative Feature Learning Supervised by
Single-Center Loss for Face Forgery Detection [89.43987367139724]
顔の偽造検出は、コンピュータビジョンへの関心をますます高めている。
近年の業績は良好なものとなっているが、いまだに無視できない問題がある。
本稿では,新しい周波数認識型特徴学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-16T14:17:17Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。