論文の概要: Associating Multi-Scale Receptive Fields for Fine-grained Recognition
- arxiv url: http://arxiv.org/abs/2005.09153v1
- Date: Tue, 19 May 2020 01:16:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 14:07:28.662584
- Title: Associating Multi-Scale Receptive Fields for Fine-grained Recognition
- Title(参考訳): 粒度認識のためのマルチスケール受容場の構築
- Authors: Zihan Ye, Fuyuan Hu, Yin Liu, Zhenping Xia, Fan Lyu, Pengqing Liu
- Abstract要約: マルチスケールの受容場を2つの操作で関連付けるために,新しい多層非局所(CNL)モジュールを提案する。
CNLはクエリ層とすべてのレスポンス層の間の相関を計算する。
モデルでは,多層層間の空間的依存関係を構築し,より識別的な特徴を学習する。
- 参考スコア(独自算出の注目度): 5.079292308180334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting and fusing part features have become the key of fined-grained
image recognition. Recently, Non-local (NL) module has shown excellent
improvement in image recognition. However, it lacks the mechanism to model the
interactions between multi-scale part features, which is vital for fine-grained
recognition. In this paper, we propose a novel cross-layer non-local (CNL)
module to associate multi-scale receptive fields by two operations. First, CNL
computes correlations between features of a query layer and all response
layers. Second, all response features are weighted according to the
correlations and are added to the query features. Due to the interactions of
cross-layer features, our model builds spatial dependencies among multi-level
layers and learns more discriminative features. In addition, we can reduce the
aggregation cost if we set low-dimensional deep layer as query layer.
Experiments are conducted to show our model achieves or surpasses
state-of-the-art results on three benchmark datasets of fine-grained
classification. Our codes can be found at github.com/FouriYe/CNL-ICIP2020.
- Abstract(参考訳): 抽出・融合部特徴が微粒化画像認識の鍵となっている。
最近,Non-local (NL) モジュールは画像認識に優れていた。
しかし、マルチスケール部分特徴間の相互作用をモデル化するメカニズムが欠如しており、これはきめ細かい認識に不可欠である。
本稿では,複数スケールの受容場を2つの演算で関連付ける新しいクロスレイヤー非局所(cnl)モジュールを提案する。
まず、cnlはクエリ層とすべての応答層の間の相関を計算する。
第2に、すべての応答機能は相関に従って重み付けされ、クエリ機能に追加される。
層間特性の相互作用により,本モデルは多層層間の空間依存性を構築し,より識別的な特徴を学習する。
さらに,低次元深層をクエリ層として設定すれば,集約コストを低減できる。
詳細な分類の3つのベンチマークデータセットにおいて、我々のモデルが最先端の結果を達成または上回ることを示す実験を行った。
我々のコードはgithub.com/fouriye/cnl-icip2020にある。
関連論文リスト
- On Layer-wise Representation Similarity: Application for Multi-Exit Models with a Single Classifier [20.17288970927518]
本研究では,各変圧器の隠蔽層間の表現の類似性について検討する。
本稿では,内部表現の類似性を高めるための協調学習手法を提案する。
論文 参考訳(メタデータ) (2024-06-20T16:41:09Z) - Efficient and Effective Deep Multi-view Subspace Clustering [9.6753782215283]
E$2$MVSC(Efficient and Effective Deep Multi-View Subspace Clustering)と呼ばれる新しいディープフレームワークを提案する。
パラメータ化されたFC層の代わりに、より計算効率のよいサンプル数からネットワークパラメータスケールを分離するRelation-Metric Netを設計する。
E$2$MVSCは既存のメソッドに匹敵する結果を出し、様々なタイプのマルチビューデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-10-15T03:08:25Z) - Hierarchical Matching and Reasoning for Multi-Query Image Retrieval [113.44470784756308]
マルチクエリ画像検索のための階層マッチング・推論ネットワーク(HMRN)を提案する。
MQIRを3つの階層的なセマンティック表現に分解し、きめ細かい局所的な詳細、文脈的グローバルスコープ、高レベルの固有の相関をキャプチャする責任を負う。
我々のHMRNは最先端の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2023-06-26T07:03:56Z) - Part-guided Relational Transformers for Fine-grained Visual Recognition [59.20531172172135]
識別的特徴を学習し,特徴変換モジュールとの相関関係を探索するフレームワークを提案する。
提案手法は,3-of-the-levelオブジェクト認識において,部分ブランチの追加に頼らず,最先端の性能に達する。
論文 参考訳(メタデータ) (2022-12-28T03:45:56Z) - Feature Aggregation and Propagation Network for Camouflaged Object
Detection [42.33180748293329]
カモフラージュされたオブジェクト検出(COD)は、環境に埋め込まれたカモフラージュされたオブジェクトを検出し、分離することを目的としている。
いくつかのCOD法が開発されているが, 前景オブジェクトと背景環境との固有の類似性により, 依然として不満足な性能に悩まされている。
カモフラージュされた物体検出のための新しい特徴集約・伝播ネットワーク(FAP-Net)を提案する。
論文 参考訳(メタデータ) (2022-12-02T05:54:28Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。