論文の概要: Channelized Axial Attention for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2101.07434v2
- Date: Wed, 17 Mar 2021 16:24:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-26 08:41:41.590971
- Title: Channelized Axial Attention for Semantic Segmentation
- Title(参考訳): セマンティクスセグメンテーションのためのチャンネル化軸方向注意
- Authors: Ye Huang, Wenjing Jia, Xiangjian He, Liu Liu, Yuxin Li, Dacheng Tao
- Abstract要約: チャネルアキシャルアテンション(CAA)を提案し、チャネルアテンションと軸アテンションをシームレスに統合し、計算複雑性を低減します。
私たちのCAAは、DANetのような他の注意モデルに比べて計算リソースをはるかに少なくするだけでなく、すべての検証済みデータセット上で最先端のResNet-101ベースのセグメンテーションモデルよりも優れています。
- 参考スコア(独自算出の注目度): 70.14921019774793
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-attention and channel attention, modelling thesemantic interdependencies
in spatial and channel dimensionsrespectively, have recently been widely used
for semantic seg-mentation. However, computing spatial-attention and
channelattention separately and then fusing them directly can causeconflicting
feature representations. In this paper, we proposethe Channelized Axial
Attention (CAA) to seamlessly integratechannel attention and axial attention
with reduced computationalcomplexity. After computing axial attention maps, we
propose tochannelize the intermediate results obtained from the
transposeddot-product so that the channel importance of each axial
repre-sentation is optimized across the whole receptive field. We
furtherdevelop grouped vectorization, which allows our model to be runwith very
little memory consumption at a speed comparableto the full vectorization.
Comparative experiments conductedon multiple benchmark datasets, including
Cityscapes, PASCALContext and COCO-Stuff, demonstrate that our CAA not
onlyrequires much less computation resources compared with otherdual attention
models such as DANet, but also outperformsthe state-of-the-art ResNet-101-based
segmentation models on alltested datasets.
- Abstract(参考訳): 空間次元とチャネル次元の相互依存を空間的にモデル化する自己注意とチャネルアテンションは,近年セグメンテーションに広く利用されている。
しかし、空間的アテンションとチャネル的アテンションを別々に計算し、それらを直接融合させることで特徴表現の衝突を引き起こす。
本稿では,チャネル化軸アテンション(CAA)について,計算複雑度を低減したチャネルアテンションと軸アテンションをシームレスに統合する手法を提案する。
軸方向のアテンションマップを計算した後, トランスポジドート生成物から得られた中間結果をチャネル化し, それぞれのアキシャルリフレセプションのチャネル重要度を受容領域全体にわたって最適化する。
グループ化されたベクトル化をさらに発展させ、完全なベクトル化に匹敵する速度で、非常に少ないメモリ消費でモデルを動作させることができる。
cityscapes、pascalcontext、coco-stuffを含む複数のベンチマークデータセットで行った比較実験では、caaはdanetのような他の注意モデルに比べて計算リソースをはるかに少なくするだけでなく、すべてのテスト済みデータセットにおけるresnet-101ベースのセグメンテーションモデルよりも優れています。
関連論文リスト
- CSA-Net: Channel-wise Spatially Autocorrelated Attention Networks [19.468704622654357]
深部CNNに対するチャネルワイド空間自己相関(CSA)アテンション機構を提案する。
地理的解析にインスパイアされた提案CSAは,特徴写像のチャネル間の空間的関係を利用して,効果的なチャネル記述子を生成する。
我々は、ImageNetおよびMS COCOベンチマークデータセットの広範な実験と分析により、提案したCSAネットワークの有効性を検証する。
論文 参考訳(メタデータ) (2024-05-09T13:21:03Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Efficient Multi-Scale Attention Module with Cross-Spatial Learning [4.046170185945849]
効率的なマルチスケールアテンション(EMA)モジュールを提案する。
チャネルごとの情報保持と計算オーバーヘッドの低減に重点を置いている。
我々は画像分類と物体検出タスクについて広範囲にわたるアブレーション研究と実験を行った。
論文 参考訳(メタデータ) (2023-05-23T00:35:47Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Attention in Attention: Modeling Context Correlation for Efficient Video
Classification [47.938500236792244]
本稿では,注目度向上のためのAIA手法を提案する。
ビデオ特徴コンテキストを,グローバル平均およびプール操作を伴う特定の軸に沿って集約されたダイナミックスとしてインスタンス化する。
注意ユニット内の全ての計算処理は、プール化された次元に作用し、計算コストの増大は極めて少ない。
論文 参考訳(メタデータ) (2022-04-20T08:37:52Z) - Fully Attentional Network for Semantic Segmentation [17.24768249911501]
単一類似マップにおいて,空間的注意とチャネル的注意の両方を符号化するフルアテンショナル・ネットワーク(FLANet)を提案する。
我々の新しい手法は3つの挑戦的セマンティックセグメンテーションデータセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2021-12-08T04:34:55Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - Channel Pruning Guided by Spatial and Channel Attention for DNNs in
Intelligent Edge Computing [15.248962858090431]
重要な課題は、どのチャネルを削除すべきかを判断し、モデルの精度が負の影響を受けないようにすることだ。
本稿では,空間的注意とチャネル的注意の両方を組み合わせた新しいアテンションモジュールを提案する。
SCAのガイダンスにより、CPSCAアプローチは、他の最先端のプルーニング手法よりも高い推論精度を実現する。
論文 参考訳(メタデータ) (2020-11-08T02:40:06Z) - Adaptive feature recombination and recalibration for semantic
segmentation with Fully Convolutional Networks [57.64866581615309]
完全畳み込みネットワークを用いたセマンティックセグメンテーションに適応した特徴の組換えと空間適応型再分類ブロックを提案する。
その結果、再結合と再校正は競争ベースラインの結果を改善し、3つの異なる問題にまたがって一般化することを示した。
論文 参考訳(メタデータ) (2020-06-19T15:45:03Z) - Hybrid Multiple Attention Network for Semantic Segmentation in Aerial
Images [24.35779077001839]
グローバルな相関関係を適応的に捉えるために,Hybrid Multiple Attention Network (HMANet) という新しいアテンションベースのフレームワークを提案する。
本稿では,機能的冗長性を低減し,自己注意機構の効率を向上させるため,単純で効果的な領域シャッフルアテンション(RSA)モジュールを提案する。
論文 参考訳(メタデータ) (2020-01-09T07:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。