論文の概要: CAT: Learning to Collaborate Channel and Spatial Attention from
Multi-Information Fusion
- arxiv url: http://arxiv.org/abs/2212.06335v1
- Date: Tue, 13 Dec 2022 02:34:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 14:47:29.225211
- Title: CAT: Learning to Collaborate Channel and Spatial Attention from
Multi-Information Fusion
- Title(参考訳): CAT:マルチ情報融合によるチャネルと空間的注意の協調学習
- Authors: Zizhang Wu, Man Wang, Weiwei Sun, Yuchen Li, Tianhao Xu, Fan Wang,
Keke Huang
- Abstract要約: 本稿では,空間とチャネルのアテンション間の協調を活性化する「CAT」と呼ばれるプラグイン・アンド・プレイアテンション・モジュールを提案する。
具体的には、特徴を訓練可能な係数(コラ因子)として表現し、異なる注意モジュールの寄与を適応的に組み合わせる。
我々のCATは、オブジェクト検出、インスタンスセグメンテーション、画像分類において、既存の最先端の注意機構よりも優れています。
- 参考スコア(独自算出の注目度): 23.72040577828098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Channel and spatial attention mechanism has proven to provide an evident
performance boost of deep convolution neural networks (CNNs). Most existing
methods focus on one or run them parallel (series), neglecting the
collaboration between the two attentions. In order to better establish the
feature interaction between the two types of attention, we propose a
plug-and-play attention module, which we term "CAT"-activating the
Collaboration between spatial and channel Attentions based on learned Traits.
Specifically, we represent traits as trainable coefficients (i.e.,
colla-factors) to adaptively combine contributions of different attention
modules to fit different image hierarchies and tasks better. Moreover, we
propose the global entropy pooling (GEP) apart from global average pooling
(GAP) and global maximum pooling (GMP) operators, an effective component in
suppressing noise signals by measuring the information disorder of feature
maps. We introduce a three-way pooling operation into attention modules and
apply the adaptive mechanism to fuse their outcomes. Extensive experiments on
MS COCO, Pascal-VOC, Cifar-100, and ImageNet show that our CAT outperforms
existing state-of-the-art attention mechanisms in object detection, instance
segmentation, and image classification. The model and code will be released
soon.
- Abstract(参考訳): チャネルと空間的注意機構は、深層畳み込みニューラルネットワーク(cnns)の性能向上をもたらすことが証明されている。
既存のほとんどのメソッドは1つまたは並列(シリーズ)にフォーカスしており、2つの注意の間のコラボレーションを無視している。
本研究では,2種類の注意点間の特徴的相互作用をより明確にするために,学習経路に基づく空間的・チャネル的注意点の協調を「CAT」と呼ぶ,プラグアンドプレイ型注意点モジュールを提案する。
具体的には、特徴を訓練可能な係数(コラ因子)として表現し、異なるアテンションモジュールのコントリビューションを適応的に組み合わせて、異なる画像階層やタスクに適合させる。
さらに,大域的平均プーリング (gap) と大域的最大プーリング (gmp) を別にして, 特徴地図の情報障害を計測し, 雑音信号の抑制に有効な成分である大域的エントロピープーリング (gep) を提案する。
本稿では,アテンションモジュールに3方向プーリング操作を導入し,アダプティブ機構を適用して結果を融合する。
MS COCO, Pascal-VOC, Cifar-100, ImageNet の大規模な実験により,我々のCAT はオブジェクト検出, インスタンス分割, 画像分類において, 既存の最先端の注意機構より優れていることが示された。
モデルとコードはまもなくリリースされる。
関連論文リスト
- Holistic Prototype Attention Network for Few-Shot VOS [74.25124421163542]
FSVOS(Few-shot Video Object segmentation)は、少数のサポートイメージに頼って、目に見えないクラスの動的オブジェクトをセグメントすることを目的としている。
本稿では,FSVOS を前進させるための総合プロトタイプアテンションネットワーク (HPAN) を提案する。
論文 参考訳(メタデータ) (2023-07-16T03:48:57Z) - Efficient Multi-Scale Attention Module with Cross-Spatial Learning [4.046170185945849]
効率的なマルチスケールアテンション(EMA)モジュールを提案する。
チャネルごとの情報保持と計算オーバーヘッドの低減に重点を置いている。
我々は画像分類と物体検出タスクについて広範囲にわたるアブレーション研究と実験を行った。
論文 参考訳(メタデータ) (2023-05-23T00:35:47Z) - Feedback Chain Network For Hippocampus Segmentation [59.74305660815117]
海馬セグメンテーションタスクのための階層型フィードバックチェーンネットワークを提案する。
提案手法は,3つの公開データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-11-15T04:32:10Z) - Deep Attention-guided Graph Clustering with Dual Self-supervision [49.040136530379094]
デュアル・セルフ・スーパービジョン(DAGC)を用いたディープアテンション誘導グラフクラスタリング法を提案する。
我々は,三重項Kulback-Leibler分散損失を持つソフトな自己スーパービジョン戦略と,擬似的な監督損失を持つハードな自己スーパービジョン戦略からなる二重自己スーパービジョンソリューションを開発する。
提案手法は6つのベンチマークデータセットにおける最先端の手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-10T06:53:03Z) - An Attention Module for Convolutional Neural Networks [5.333582981327498]
本稿では,AW-畳み込みを開発することで,畳み込みニューラルネットワークのためのアテンションモジュールを提案する。
画像分類とオブジェクト検出タスクのための複数のデータセットの実験により,提案した注目モジュールの有効性が示された。
論文 参考訳(メタデータ) (2021-08-18T15:36:18Z) - CaEGCN: Cross-Attention Fusion based Enhanced Graph Convolutional
Network for Clustering [51.62959830761789]
クロスアテンションに基づくディープクラスタリングフレームワークCross-Attention Fusion based Enhanced Graph Convolutional Network (CaEGCN)を提案する。
CaEGCNには、クロスアテンション融合、Content Auto-Encoder、Graph Convolutional Auto-Encoder、および自己監視モデルという4つの主要なモジュールが含まれている。
異なるタイプのデータセットに対する実験結果は、提案したCaEGCNの優位性とロバスト性を証明する。
論文 参考訳(メタデータ) (2021-01-18T05:21:59Z) - Attention-Guided Network for Iris Presentation Attack Detection [13.875545441867137]
本稿では注意誘導型アイリス提示攻撃検出(AG-PAD)を提案する。
JHU-APLプロプライエタリデータセットとベンチマークのLivDet-Iris-2017データセットの両方を含む実験は、提案手法が有望な結果をもたらすことを示唆している。
論文 参考訳(メタデータ) (2020-10-23T19:23:51Z) - Rotate to Attend: Convolutional Triplet Attention Module [21.228370317693244]
3分岐構造を用いた新しい注意重み計算法である三重項注意法を提案する。
本手法は単純かつ効率的であり,アドオンモジュールとして従来のバックボーンネットワークに簡単に接続できる。
ImageNet-1k上の画像分類や,MSCOCOおよびPASCAL VOCデータセット上でのオブジェクト検出など,様々な課題に対する本手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-10-06T21:31:00Z) - Single Image Super-Resolution via a Holistic Attention Network [87.42409213909269]
本稿では,階層,チャネル,位置間の全体的相互依存性をモデル化するための新しい全体論的注意ネットワーク(HAN)を提案する。
提案したHANは階層的特徴を適応的に強調し,層間相関を考慮した。
実験により、提案HANは、最先端の単一画像超解像アプローチに対して好適に機能することが示された。
論文 参考訳(メタデータ) (2020-08-20T04:13:15Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。