論文の概要: Adaptive receptive field-based spatial-frequency feature reconstruction network for few-shot fine-grained image classification
- arxiv url: http://arxiv.org/abs/2604.16936v1
- Date: Sat, 18 Apr 2026 09:40:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.248535
- Title: Adaptive receptive field-based spatial-frequency feature reconstruction network for few-shot fine-grained image classification
- Title(参考訳): 数ショットきめ細かい画像分類のための適応受容場に基づく空間周波数特徴再構成ネットワーク
- Authors: Linyue Zhang, Wenyi Zeng, Zicheng Pan, Yongsheng Gao, Changming Sun, Jun Hu, Lixian Liu, Weichuan Zhang, Tuo Wang,
- Abstract要約: 適応型受容場に基づく空間周波数特徴再構成ネットワーク(ARF-SFR-Net)を提案する。
ARF-SFR-Netは、スクラッチからエンドツーエンドトレーニングのための所定のエピソードトレーニング機構に容易に組み込むことができる。
- 参考スコア(独自算出の注目度): 22.358641470821244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature reconstruction techniques are widely applied for few-shot fine-grained image classification (FSFGIC). Our research indicates that one of the main challenges facing existing feature-based FSFGIC methods is how to choose the size of the receptive field to extract feature descriptors (including spatial and frequency feature descriptors) from different category input images, thereby better performing the FSFGIC tasks. To address this, an adaptive receptive field-based spatial-frequency feature reconstruction network (ARF-SFR-Net) is proposed. The designed ARF-SFR-Net has the capability to adaptively determine receptive field sizes for obtaining spatial and frequency features, and effectively fuse them for reconstruction and FSFGIC tasks. The designed ARF-SFR-Net can be easily embedded into a given episodic training mechanism for end-to-end training from scratch. Extensive experiments on multiple FSFGIC benchmarks demonstrate the effectiveness and superiority of the proposed ARF-SFR-Net over state-of-the-art approaches. The code is available at: https://github.com/ICL-SUST/ARF-SFR-Net.git.
- Abstract(参考訳): 特徴再構成技術は、FSFGIC ( few-shot fine-grained image classification) に広く応用されている。
本研究は,既存のFSFGIC手法が直面する主な課題の1つとして,異なるカテゴリの入力画像から特徴記述子(空間および周波数特徴記述子を含む)を抽出し,FSFGICタスクをより良く実行する方法があげられる。
そこで,適応型受容場に基づく空間周波数特徴再構成ネットワーク(ARF-SFR-Net)を提案する。
設計されたARF-SFR-Netは、空間的および周波数的特徴を得るための受容野の大きさを適応的に決定し、再構成やFSFGICタスクのためにそれらを効果的に融合する能力を有する。
ARF-SFR-Netの設計は、与えられたエピソードトレーニング機構に簡単に組み込むことができ、エンドツーエンドのトレーニングをスクラッチから行うことができる。
複数のFSFGICベンチマークに対する大規模な実験は、最先端のアプローチよりも提案されたARF-SFR-Netの有効性と優位性を示している。
コードはhttps://github.com/ICL-SUST/ARF-SFR-Net.gitで公開されている。
関連論文リスト
- SFFR: Spatial-Frequency Feature Reconstruction for Multispectral Aerial Object Detection [12.521255528136278]
本研究では,新しい空間周波数特徴再構成法 (SFFR) を提案する。
特徴融合の前に空間領域と周波数領域の相補表現を再構成する。
提案するFCEKANモジュールとMSGKANモジュールは相補的であり,それぞれの周波数と空間的意味的特徴を効果的に捉えることができることを示す。
論文 参考訳(メタデータ) (2025-11-09T09:34:10Z) - MF-NeRF: Memory Efficient NeRF with Mixed-Feature Hash Table [62.164549651134465]
MF-NeRFは,Mixed-Featureハッシュテーブルを用いてメモリ効率を向上し,再構成品質を維持しながらトレーニング時間を短縮するメモリ効率の高いNeRFフレームワークである。
最新技術であるInstant-NGP、TensoRF、DVGOによる実験は、MF-NeRFが同じGPUハードウェア上で、同様のあるいはそれ以上のリコンストラクション品質で最速のトレーニング時間を達成できることを示唆している。
論文 参考訳(メタデータ) (2023-04-25T05:44:50Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - Disentangled Feature Representation for Few-shot Image Classification [64.40410801469106]
そこで本研究では,DFRと呼ばれる新しいDistangled Feature Representationフレームワークを提案する。
DFRは、分類枝によってモデル化される識別的特徴を、変動枝のクラス非関連成分から適応的に分離することができる。
一般的に、一般的な深層数ショット学習手法のほとんどが分類ブランチとしてプラグインできるため、DFRは様々な数ショットタスクのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2021-09-26T09:53:11Z) - TBNet:Two-Stream Boundary-aware Network for Generic Image Manipulation
Localization [49.521622399483846]
汎用画像操作のローカライゼーションのための新しいエンド・ツー・エンド2ストリーム境界対応ネットワーク(TBNet)を提案する。
提案したTBNetは、MCCとF1の両方の観点から、最先端の汎用画像操作のローカライズ手法を大幅に上回ることができる。
論文 参考訳(メタデータ) (2021-08-10T08:22:05Z) - Random Partitioning Forest for Point-Wise and Collective Anomaly
Detection -- Application to Intrusion Detection [9.74672460306765]
DiFF-RFはランダムな分割二分木で構成されるアンサンブルアプローチであり、異常を検出する。
実験の結果,DiFF-RFはアイソレーション・フォレスト(IF)アルゴリズムをほぼ体系的に上回っていることがわかった。
我々の経験から,DiFF-RFは小規模な学習データの存在下では有効であることがわかった。
論文 参考訳(メタデータ) (2020-06-29T10:44:08Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。