論文の概要: Semantic Interleaving Global Channel Attention for Multilabel Remote
Sensing Image Classification
- arxiv url: http://arxiv.org/abs/2208.02613v1
- Date: Thu, 4 Aug 2022 12:28:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-05 12:38:56.411638
- Title: Semantic Interleaving Global Channel Attention for Multilabel Remote
Sensing Image Classification
- Title(参考訳): マルチラベルリモートセンシング画像分類のための意味的インターリービンググローバルチャネル注意
- Authors: Yongkun Liu, Kesong Ni, Yuhan Zhang, Lijian Zhou and Kun Zhao
- Abstract要約: マルチラベルリモートセンシング画像分類(MLRSIC)は研究の関心が高まっている。
複数のラベルの共起関係を付加情報として捉えることで、このタスクの性能を向上させることができる。
現在の手法では、特徴表現を形成するためにラベル相関をフル活用していない。
本稿では,MLRSICに対してSIGNA(Semantic Interleaving Global Channel Attention)と呼ばれる新しい手法を提案する。
- 参考スコア(独自算出の注目度): 6.52523058108343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-Label Remote Sensing Image Classification (MLRSIC) has received
increasing research interest. Taking the cooccurrence relationship of multiple
labels as additional information helps to improve the performance of this task.
Current methods focus on using it to constrain the final feature output of a
Convolutional Neural Network (CNN). On the one hand, these methods do not make
full use of label correlation to form feature representation. On the other
hand, they increase the label noise sensitivity of the system, resulting in
poor robustness. In this paper, a novel method called Semantic Interleaving
Global Channel Attention (SIGNA) is proposed for MLRSIC. First, the label
co-occurrence graph is obtained according to the statistical information of the
data set. The label co-occurrence graph is used as the input of the Graph
Neural Network (GNN) to generate optimal feature representations. Then, the
semantic features and visual features are interleaved, to guide the feature
expression of the image from the original feature space to the semantic feature
space with embedded label relations. SIGNA triggers global attention of feature
maps channels in a new semantic feature space to extract more important visual
features. Multihead SIGNA based feature adaptive weighting networks are
proposed to act on any layer of CNN in a plug-and-play manner. For remote
sensing images, better classification performance can be achieved by inserting
CNN into the shallow layer. We conduct extensive experimental comparisons on
three data sets: UCM data set, AID data set, and DFC15 data set. Experimental
results demonstrate that the proposed SIGNA achieves superior classification
performance compared to state-of-the-art (SOTA) methods. It is worth mentioning
that the codes of this paper will be open to the community for reproducibility
research. Our codes are available at https://github.com/kyle-one/SIGNA.
- Abstract(参考訳): マルチラベルリモートセンシング画像分類(MLRSIC)は研究の関心が高まっている。
複数のラベルの共起関係を追加情報として取ることは、このタスクのパフォーマンスを改善するのに役立つ。
現在の手法では、畳み込みニューラルネットワーク(cnn)の最終的な特徴出力を制限するためにそれを使用する。
一方、これらの手法は特徴表現を形成するためにラベル相関を完全に利用しない。
一方で、システムのラベルノイズ感度が向上し、ロバスト性が低下する。
本稿では,MLRSICに対してSIGNA(Semantic Interleaving Global Channel Attention)と呼ばれる新しい手法を提案する。
まず、データセットの統計情報に基づいてラベル共起グラフを求める。
ラベル共起グラフはグラフニューラルネットワーク(GNN)の入力として使われ、最適な特徴表現を生成する。
次に、意味的特徴と視覚的特徴をインターリーブし、元の特徴空間から埋め込みラベル関係を持つ意味的特徴空間へ画像の特徴表現を誘導する。
SIGNAは、より重要な視覚的特徴を抽出するために、新しい意味的特徴空間における機能マップチャネルのグローバルな注意を喚起する。
マルチヘッドSIGNAに基づく特徴適応重み付けネットワークは,CNNの任意の層にプラグアンドプレイで作用する。
リモートセンシング画像の場合、浅い層にCNNを挿入することで、より良い分類性能が得られる。
UCMデータセット, AIDデータセット, DFC15データセットの3つのデータセットについて, 広範囲にわたる実験的比較を行った。
実験結果から,提案したSIGNAは最先端(SOTA)法よりも優れた分類性能を示すことが示された。
本論文のコードは再現性研究のためにコミュニティに開放されることに留意すべきである。
私たちのコードはhttps://github.com/kyle-one/signaで利用可能です。
関連論文リスト
- MFGNet: Dynamic Modality-Aware Filter Generation for RGB-T Tracking [72.65494220685525]
可視データと熱データ間のメッセージ通信を促進するために,新しい動的モダリティ対応フィルタ生成モジュール(MFGNet)を提案する。
我々は、2つの独立ネットワークを持つ動的モダリティ対応フィルタを生成し、その可視フィルタとサーマルフィルタをそれぞれ、対応する入力特徴写像上で動的畳み込み演算を行う。
重閉塞,高速移動,外見による問題に対処するため,新たな方向認識型目標誘導型アテンション機構を活用することで,共同で局所的・グローバル検索を行うことを提案する。
論文 参考訳(メタデータ) (2021-07-22T03:10:51Z) - Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition [53.17837649440601]
本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-05T10:10:12Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - Multi-Label Text Classification using Attention-based Graph Neural
Network [0.0]
ラベル間の注意的依存構造を捉えるために,グラフアテンションネットワークに基づくモデルを提案する。
提案モデルでは, 従来の最先端モデルと比較して, 類似あるいは良好な性能が得られた。
論文 参考訳(メタデータ) (2020-03-22T17:12:43Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。