Fugu-MT 論文翻訳(概要): Few-Shot Learning by Integrating Spatial and Frequency Representation

論文の概要: Few-Shot Learning by Integrating Spatial and Frequency Representation

arxiv url: http://arxiv.org/abs/2105.05348v1
Date: Tue, 11 May 2021 21:44:31 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-13 12:25:12.303069
Title: Few-Shot Learning by Integrating Spatial and Frequency Representation
Title（参考訳）: 空間表現と周波数表現の統合によるFew-Shot Learning
Authors: Xiangyu Chen and Guanghui Wang
Abstract要約: 本稿では,システムの識別能力を高めるために,周波数情報を学習モデルに統合することを提案する。周波数表現を生成するために離散コサイン変換(dct)を用い,その特徴を空間領域と周波数領域の両方から統合して分類する。
参考スコア（独自算出の注目度）: 25.11147383752403
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Human beings can recognize new objects with only a few labeled examples, however, few-shot learning remains a challenging problem for machine learning systems. Most previous algorithms in few-shot learning only utilize spatial information of the images. In this paper, we propose to integrate the frequency information into the learning model to boost the discrimination ability of the system. We employ Discrete Cosine Transformation (DCT) to generate the frequency representation, then, integrate the features from both the spatial domain and frequency domain for classification. The proposed strategy and its effectiveness are validated with different backbones, datasets, and algorithms. Extensive experiments demonstrate that the frequency information is complementary to the spatial representations in few-shot classification. The classification accuracy is boosted significantly by integrating features from both the spatial and frequency domains in different few-shot learning tasks.
Abstract（参考訳）: 人間はいくつかのラベル付き例で新しいオブジェクトを認識できるが、機械学習システムにとって難しい課題は、ほとんどない。それまでのアルゴリズムのほとんどは、画像の空間情報のみを利用する。本稿では,システムの識別能力を高めるために,周波数情報を学習モデルに統合することを提案する。周波数表現を生成するために離散コサイン変換(dct)を用い,その特徴を空間領域と周波数領域の両方から統合して分類する。提案した戦略とその有効性は、異なるバックボーン、データセット、アルゴリズムで検証される。広範囲な実験により、周波数情報は少ないショット分類で空間表現と相補的であることが示されている。分類精度は、空間領域と周波数領域の両方の特徴を異なる数ショット学習タスクに組み込むことで大幅に向上する。

関連論文リスト

CSTA: Spatial-Temporal Causal Adaptive Learning for Exemplar-Free Video Class-Incremental Learning [62.69917996026769]
クラスインクリメンタルな学習課題は、空間的外観と時間的行動の関与の両方を学習し、保存することを必要とする。本稿では,各クラス固有のインクリメンタル情報要件を調整し,新しいクラスパターンを学習するためのアダプタを分離するフレームワークを提案する。異なる種類の情報間のインクリメントと記憶の衝突を減らすために,因果補償機構を提案する。
論文参考訳（メタデータ） (2025-01-13T11:34:55Z)
Frequency-Spatial Entanglement Learning for Camouflaged Object Detection [34.426297468968485]
既存の手法では、複雑な設計で空間的特徴の識別能力を最大化することにより、画素類似性の影響を減らそうとしている。本稿では,周波数領域と空間領域の表現を共同で探索し,周波数空間の絡み合い学習(FSEL)手法を提案する。我々の実験は、広く使われている3つのデータセットにおける包括的量的および質的比較を通じて、21以上の最先端手法によるFSELの優位性を実証した。
論文参考訳（メタデータ） (2024-09-03T07:58:47Z)
High-Discriminative Attribute Feature Learning for Generalized Zero-Shot Learning [54.86882315023791]
一般化ゼロショット学習(HDAFL)のための高識別属性特徴学習(High-Discriminative Attribute Feature Learning)という革新的な手法を提案する。 HDAFLは複数の畳み込みカーネルを使用して、画像の属性と高い相関性を持つ識別領域を自動的に学習する。また、属性間の識別能力を高めるために、Transformerベースの属性識別エンコーダを導入する。
論文参考訳（メタデータ） (2024-04-07T13:17:47Z)
Sketched Multi-view Subspace Learning for Hyperspectral Anomalous Change Detection [12.719327447589345]
異常変化検出のためのスケッチ付きマルチビューサブスペース学習モデルを提案する。提案モデルでは,画像ペアからの主要な情報を保存し,計算複雑性を向上させる。実験は、ベンチマークハイパースペクトルリモートセンシングデータセットと自然なハイパースペクトルデータセットで実施される。
論文参考訳（メタデータ） (2022-10-09T14:08:17Z)
SATS: Self-Attention Transfer for Continual Semantic Segmentation [50.51525791240729]
連続的なセマンティックセグメンテーションは、連続的な分類学習と同じ破滅的な忘れの問題に悩まされる。本研究では,各画像内の要素間の関係について,知識に関連する新しいタイプの情報伝達を提案する。関係情報は、トランスフォーマースタイルのセグメンテーションモデルにおける自己アテンションマップから有効に得ることができる。
論文参考訳（メタデータ） (2022-03-15T06:09:28Z)
Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文参考訳（メタデータ） (2022-02-10T06:23:56Z)
Residual Attention: A Simple but Effective Method for Multi-Label Recognition [29.18904701720024]
クラス固有残差注意(CSRA)という,恥ずかしいほど単純なモジュールを提案する。 CSRAは、単純な空間的注意スコアを提案し、クラスに依存しない平均プール機能と組み合わせることで、各カテゴリのクラス固有の特徴を生成する。 4行のコードだけで、CSRAは追加のトレーニングなしで、さまざまな事前訓練されたモデルやデータセットに対して一貫した改善をもたらす。
論文参考訳（メタデータ） (2021-08-05T08:45:57Z)
Generalized Zero-Shot Learning using Multimodal Variational Auto-Encoder with Semantic Concepts [0.9054540533394924]
近年の手法では,意味空間と画像空間の相互マッピングの学習が試みられている。画像特徴と意味空間の共有潜在空間を学習できるマルチモーダル変分自動エンコーダ(M-VAE)を提案する。提案手法は, ゼロショット学習における最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-06-26T20:08:37Z)
Anomalous Sound Detection Using a Binary Classification Model and Class Centroids [47.856367556856554]
本稿では, 正規データだけでなく, 他領域の外部データも擬似アノマラス音響データとして用いた二分分類モデルを提案する。また,2値分類モデルをさらに改善するために,異常音データの追加の有効性についても検討した。
論文参考訳（メタデータ） (2021-06-11T03:35:06Z)
Spatial-spectral Hyperspectral Image Classification via Multiple Random Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文参考訳（メタデータ） (2021-03-25T09:31:41Z)
Region Comparison Network for Interpretable Few-shot Image Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文参考訳（メタデータ） (2020-09-08T07:29:05Z)
Frequency learning for image classification [1.9336815376402716]
本稿では、トレーニング可能な周波数フィルタからなる入力画像のフーリエ変換を探索する新しい手法を提案する。画像ブロックの周波数領域表現からグローバル特徴とローカル特徴の両方を学習するスライシング手法を提案する。
論文参考訳（メタデータ） (2020-06-28T00:32:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。