論文の概要: Complementary Frequency-Varying Awareness Network for Open-Set
Fine-Grained Image Recognition
- arxiv url: http://arxiv.org/abs/2307.07214v1
- Date: Fri, 14 Jul 2023 08:15:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-17 14:31:51.457571
- Title: Complementary Frequency-Varying Awareness Network for Open-Set
Fine-Grained Image Recognition
- Title(参考訳): オープンセット微細画像認識のための補完周波数可変アウェアネスネットワーク
- Authors: Jiayin Sun and Hong Wang and Qiulei Dong
- Abstract要約: オープンセット画像認識はコンピュータビジョンにおける課題である。
本稿では,高周波情報と低周波情報の両方をよりよく把握できる補完周波数変化認識ネットワークを提案する。
CFANに基づいて,CFAN-OSFGRと呼ばれるオープンセットのきめ細かい画像認識手法を提案する。
- 参考スコア(独自算出の注目度): 14.450381668547259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-set image recognition is a challenging topic in computer vision. Most of
the existing works in literature focus on learning more discriminative features
from the input images, however, they are usually insensitive to the high- or
low-frequency components in features, resulting in a decreasing performance on
fine-grained image recognition. To address this problem, we propose a
Complementary Frequency-varying Awareness Network that could better capture
both high-frequency and low-frequency information, called CFAN. The proposed
CFAN consists of three sequential modules: (i) a feature extraction module is
introduced for learning preliminary features from the input images; (ii) a
frequency-varying filtering module is designed to separate out both high- and
low-frequency components from the preliminary features in the frequency domain
via a frequency-adjustable filter; (iii) a complementary temporal aggregation
module is designed for aggregating the high- and low-frequency components via
two Long Short-Term Memory networks into discriminative features. Based on
CFAN, we further propose an open-set fine-grained image recognition method,
called CFAN-OSFGR, which learns image features via CFAN and classifies them via
a linear classifier. Experimental results on 3 fine-grained datasets and 2
coarse-grained datasets demonstrate that CFAN-OSFGR performs significantly
better than 9 state-of-the-art methods in most cases.
- Abstract(参考訳): オープンセット画像認識はコンピュータビジョンにおける課題である。
文献における既存の研究の多くは、入力画像からより識別的な特徴を学習することに焦点を当てているが、通常は高周波数成分や低周波数成分に敏感であり、微粒な画像認識の性能は低下する。
この問題を解決するために、CFANと呼ばれる高周波情報と低周波情報の両方をよりよく捉えることができる補完周波数変化認識ネットワークを提案する。
提案したCFANは3つの逐次モジュールから構成される。
(i)入力画像から予備的特徴を学ぶために特徴抽出モジュールを導入する。
二 周波数調整可能なフィルタにより、周波数領域の予備的特徴から高周波成分と低周波成分の両方を分離するように設計された周波数変動フィルタリングモジュール
(iii)2つの長期短期記憶ネットワークを介して高周波・低周波成分を識別的特徴に集約するための相補的時間集約モジュールが設計されている。
さらに,CFANを用いて画像特徴を学習し,線形分類器を用いて分類する,CFAN-OSFGRと呼ばれるオープンセットのきめ細かい画像認識手法を提案する。
3つの細粒度データセットと2つの粗粒度データセットの実験結果から、ほとんどの場合、cfan-osfgrは9つの最先端メソッドよりも優れた性能を示す。
関連論文リスト
- Exploring Richer and More Accurate Information via Frequency Selection for Image Restoration [0.0]
空間および周波数領域の知識をシームレスに統合するマルチスケール周波数選択ネットワーク(MSFSNet)を導入する。
我々のMSFSNetは最先端のアルゴリズムに匹敵する性能を達成する。
論文 参考訳(メタデータ) (2024-07-12T03:10:08Z) - Exploring Cross-Domain Few-Shot Classification via Frequency-Aware Prompting [37.721042095518044]
クロスドメインなFew-Shot Learningはメタラーニングの発展に大きく貢献している。
本稿では,相互に注意を向けた周波数対応プロンプト手法を提案する。
論文 参考訳(メタデータ) (2024-06-24T08:14:09Z) - MCMS: Multi-Category Information and Multi-Scale Stripe Attention for Blind Motion Deblurring [14.874224120737438]
マルチカテゴリ情報とマルチスケールストリップアテンション機構に基づくブラインドモーションデブロアリングネットワーク(MCMS)を提案する。
このモデルは、高周波成分のエッジ情報と低周波成分の構造情報を融合させることで、動作不良を効果的に改善する。
論文 参考訳(メタデータ) (2024-05-02T08:25:52Z) - Frequency-Adaptive Pan-Sharpening with Mixture of Experts [22.28680499480492]
パンシャーピングのための新しい周波数適応型エキスパート混合学習フレームワーク(FAME)を提案する。
本手法は他の最先端技術に対して最善を尽くし,現実のシーンに対して強力な一般化能力を有する。
論文 参考訳(メタデータ) (2024-01-04T08:58:25Z) - Frequency Domain Modality-invariant Feature Learning for
Visible-infrared Person Re-Identification [79.9402521412239]
本稿では、周波数領域から見たモダリティの相違を低減するために、新しい周波数領域モダリティ不変特徴学習フレームワーク(FDMNet)を提案する。
我々のフレームワークでは、インスタンス適応振幅フィルタ(IAF)とPhrase-Preserving Normalization(PPNorm)という、2つの新しいモジュールを導入している。
論文 参考訳(メタデータ) (2024-01-03T17:11:27Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - Spatial-Temporal Frequency Forgery Clue for Video Forgery Detection in
VIS and NIR Scenario [87.72258480670627]
既存の周波数領域に基づく顔偽造検出手法では、GAN鍛造画像は、実際の画像と比較して、周波数スペクトルに明らかな格子状の視覚的アーチファクトを持つ。
本稿では,コサイン変換に基づくフォージェリークリュー拡張ネットワーク(FCAN-DCT)を提案し,より包括的な時空間特徴表現を実現する。
論文 参考訳(メタデータ) (2022-07-05T09:27:53Z) - Multi-scale frequency separation network for image deblurring [10.511076996096117]
本稿では,マルチスケール周波数分離ネットワーク (MSFS-Net) を用いた画像分解手法を提案する。
MSFS-Netは複数のスケールで画像の低周波・高周波情報をキャプチャする。
ベンチマークデータセットの実験により,提案したネットワークが最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2022-06-01T23:48:35Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - TBNet:Two-Stream Boundary-aware Network for Generic Image Manipulation
Localization [49.521622399483846]
汎用画像操作のローカライゼーションのための新しいエンド・ツー・エンド2ストリーム境界対応ネットワーク(TBNet)を提案する。
提案したTBNetは、MCCとF1の両方の観点から、最先端の汎用画像操作のローカライズ手法を大幅に上回ることができる。
論文 参考訳(メタデータ) (2021-08-10T08:22:05Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。