論文の概要: Learning Gabor Texture Features for Fine-Grained Recognition
- arxiv url: http://arxiv.org/abs/2308.05396v1
- Date: Thu, 10 Aug 2023 07:28:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 13:17:17.066519
- Title: Learning Gabor Texture Features for Fine-Grained Recognition
- Title(参考訳): 微細粒度認識のためのガバーテクスチャ特徴の学習
- Authors: Lanyun Zhu, Tianrun Chen, Jianxiong Yin, Simon See, Jun Liu
- Abstract要約: 特徴抽出のためのCNNブランチを補完する新しいテクスチャブランチを提案する。
テクスチャ特性を利用するための強力な抽出器としてGaborフィルタを革新的に活用する。
複数のデータセットに対して本手法の有効性を示す。
- 参考スコア(独自算出の注目度): 8.857789973068789
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting and using class-discriminative features is critical for
fine-grained recognition. Existing works have demonstrated the possibility of
applying deep CNNs to exploit features that distinguish similar classes.
However, CNNs suffer from problems including frequency bias and loss of
detailed local information, which restricts the performance of recognizing
fine-grained categories. To address the challenge, we propose a novel texture
branch as complimentary to the CNN branch for feature extraction. We
innovatively utilize Gabor filters as a powerful extractor to exploit texture
features, motivated by the capability of Gabor filters in effectively capturing
multi-frequency features and detailed local information. We implement several
designs to enhance the effectiveness of Gabor filters, including imposing
constraints on parameter values and developing a learning method to determine
the optimal parameters. Moreover, we introduce a statistical feature extractor
to utilize informative statistical information from the signals captured by
Gabor filters, and a gate selection mechanism to enable efficient computation
by only considering qualified regions as input for texture extraction. Through
the integration of features from the Gabor-filter-based texture branch and
CNN-based semantic branch, we achieve comprehensive information extraction. We
demonstrate the efficacy of our method on multiple datasets, including
CUB-200-2011, NA-bird, Stanford Dogs, and GTOS-mobile. State-of-the-art
performance is achieved using our approach.
- Abstract(参考訳): きめ細かな認識にはクラス識別特徴の抽出と利用が不可欠である。
既存の作品は、類似のクラスを区別する機能を悪用するために深いcnnを適用する可能性を実証している。
しかし、CNNは、周波数バイアスや詳細なローカル情報の喪失などの問題に悩まされ、細粒度カテゴリの認識性能が制限される。
この課題に対処するために,特徴抽出のためのCNNブランチを補完する新しいテクスチャブランチを提案する。
我々はガボルフィルタを強力な抽出器として革新的に利用し、多周波の特徴を効果的に捉えたガボルフィルタの機能と詳細な局所情報により、テクスチャ特性を利用する。
パラメータ値に制約を課したり,最適なパラメータを決定するための学習法を開発するなど,gaborフィルタの有効性を高めるため,いくつかの設計を実装した。
さらに,gaborフィルタで取得した信号から情報的統計情報を利用する統計特徴抽出器と,テクスチャ抽出の入力として適格領域のみを考慮し,効率的な計算を可能にするゲート選択機構を提案する。
gaborフィルタベースのテクスチャブランチとcnnベースのセマンティクスブランチの機能の統合により、包括的な情報抽出を実現する。
CUB-200-2011,NA-bird,Stanford Dogs,GTOS-mobileなど,複数のデータセットに対する本手法の有効性を示す。
我々の手法により最先端のパフォーマンスが達成される。
関連論文リスト
- A Noise and Edge extraction-based dual-branch method for Shallowfake and Deepfake Localization [15.647035299476894]
従来のCNN機能と手動で設計した特徴雑音を統合したデュアルブランチモデルを開発した。
このモデルは比較において優れており、既存の最先端モデル(SoTA)よりも容易に優れている。
論文 参考訳(メタデータ) (2024-09-02T02:18:34Z) - Boosting Hyperspectral Image Classification with Gate-Shift-Fuse Mechanisms in a Novel CNN-Transformer Approach [8.982950112225264]
本稿では,GSFブロックと変圧器ブロックの2つの畳み込みブロックを含むHSI分類モデルを提案する。
GSFブロックは局所的および大域的空間スペクトルの特徴の抽出を強化するように設計されている。
HSI立方体からの情報の抽出を促進するために,効果的な注意機構モジュールも提案されている。
論文 参考訳(メタデータ) (2024-06-20T09:05:50Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - From Interpretable Filters to Predictions of Convolutional Neural
Networks with Explainable Artificial Intelligence [0.0]
我々は,コビッド19と非コビッド19の分類に使用されるcnnexplainと呼ばれるCNNモデルの説明可能性に注目した。
我々は、可視化、SmoothGrad、Grad-CAM、LIMEなど、さまざまな説明可能な人工知能(XAI)の手法を用いて、畳み込みフィルタの解釈を行っている。
論文 参考訳(メタデータ) (2022-07-26T15:05:25Z) - Batch Normalization Tells You Which Filter is Important [49.903610684578716]
我々は,事前学習したCNNのBNパラメータに基づいて,各フィルタの重要性を評価することによって,簡易かつ効果的なフィルタ刈取法を提案する。
CIFAR-10とImageNetの実験結果から,提案手法が優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-12-02T12:04:59Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Unsupervised Feedforward Feature (UFF) Learning for Point Cloud
Classification and Segmentation [57.62713515497585]
3次元点雲の連成分類とセグメンテーションのために,教師なしフィードフォワード特徴学習を提案する。
UFF法は、点雲セット内の点の統計的相関を利用して、1パスのフィードフォワード方式で形状と点の特徴を学習する。
エンコーダとローカルポイントでグローバルな形状の特徴を、エンコーダ-デコーダアーキテクチャを通して学習する。
論文 参考訳(メタデータ) (2020-09-02T18:25:25Z) - iffDetector: Inference-aware Feature Filtering for Object Detection [70.8678270164057]
Inference-aware Feature Filtering (IFF)モジュールを導入し、現代の検出器と簡単に組み合わせることができる。
IFFは、畳み込み機能を強化するためにハイレベルなセマンティクスを活用することでクローズドループ最適化を行う。
IFFはCNNベースの物体検出器とプラグアンドプレイ方式で融合でき、計算コストのオーバーヘッドは無視できる。
論文 参考訳(メタデータ) (2020-06-23T02:57:29Z) - Hybrid Embedded Deep Stacked Sparse Autoencoder with w_LPPD SVM Ensemble [13.981652331491558]
本稿では,新しいディープオートエンコーダについて述べる。
トレーニング中にオリジナルの機能を埋め込んで、弱い隠蔽層出力をフィルタリングすることで、差別的な深い特徴を学習することができる。
実験の結果,提案した特徴学習法は,他の既存および最先端の特徴学習アルゴリズムと比較して,優れた性能を示すことがわかった。
論文 参考訳(メタデータ) (2020-02-17T04:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。