論文の概要: Fully Attentional Network for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2112.04108v1
- Date: Wed, 8 Dec 2021 04:34:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 14:42:51.617538
- Title: Fully Attentional Network for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションのための完全注意ネットワーク
- Authors: Qi Song, Jie Li, Chenghong Li, Hao Guo, Rui Huang
- Abstract要約: 単一類似マップにおいて,空間的注意とチャネル的注意の両方を符号化するフルアテンショナル・ネットワーク(FLANet)を提案する。
我々の新しい手法は3つの挑戦的セマンティックセグメンテーションデータセットに対して最先端の性能を達成した。
- 参考スコア(独自算出の注目度): 17.24768249911501
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent non-local self-attention methods have proven to be effective in
capturing long-range dependencies for semantic segmentation. These methods
usually form a similarity map of RC*C (by compressing spatial dimensions) or
RHW*HW (by compressing channels) to describe the feature relations along either
channel or spatial dimensions, where C is the number of channels, H and W are
the spatial dimensions of the input feature map. However, such practices tend
to condense feature dependencies along the other dimensions,hence causing
attention missing, which might lead to inferior results for small/thin
categories or inconsistent segmentation inside large objects. To address this
problem, we propose anew approach, namely Fully Attentional Network (FLANet),to
encode both spatial and channel attentions in a single similarity map while
maintaining high computational efficiency. Specifically, for each channel map,
our FLANet can harvest feature responses from all other channel maps, and the
associated spatial positions as well, through a novel fully attentional module.
Our new method has achieved state-of-the-art performance on three challenging
semantic segmentation datasets,i.e., 83.6%, 46.99%, and 88.5% on the Cityscapes
test set,the ADE20K validation set, and the PASCAL VOC test set,respectively.
- Abstract(参考訳): 近年の非局所的自己認識法は,意味的セグメンテーションのための長距離依存関係の捕捉に有効であることが証明されている。
これらの方法は、通常、(空間次元を圧縮することによって)RC*CやRHW*HWの類似性マップを形成し、(チャネルを圧縮することによって)チャネルまたは空間次元に沿った特徴関係を記述する(Cはチャネルの数、HとWは入力特徴写像の空間次元)。
しかし、このようなプラクティスは、他の次元に沿って機能依存性を凝縮し、注意をそらす傾向があり、小さな/薄いカテゴリや大きなオブジェクト内の一貫性のないセグメンテーションでは、結果が劣る可能性がある。
この問題に対処するため,FLANet (Fully Attentional Network) という新しい手法を提案し,高い計算効率を維持しつつ,空間とチャネルの両方の注意を単一の類似性マップに符号化する。
具体的には、各チャンネルマップに対して、フラネットは、新しい完全に注意深いモジュールを通して、他のすべてのチャンネルマップと関連する空間位置から特徴応答を収集できる。
提案手法は,Cityscapesテストセット,ADE20K検証セット,PASCAL VOCテストセットの3つの挑戦的セマンティックセマンティックセマンティクスデータセット,すなわち83.6%,46.99%,88.5%に対して,最先端の性能を達成した。
関連論文リスト
- Efficient Multi-Scale Attention Module with Cross-Spatial Learning [4.046170185945849]
効率的なマルチスケールアテンション(EMA)モジュールを提案する。
チャネルごとの情報保持と計算オーバーヘッドの低減に重点を置いている。
我々は画像分類と物体検出タスクについて広範囲にわたるアブレーション研究と実験を行った。
論文 参考訳(メタデータ) (2023-05-23T00:35:47Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Channelized Axial Attention for Semantic Segmentation [70.14921019774793]
チャネルアキシャルアテンション(CAA)を提案し、チャネルアテンションと軸アテンションをシームレスに統合し、計算複雑性を低減します。
私たちのCAAは、DANetのような他の注意モデルに比べて計算リソースをはるかに少なくするだけでなく、すべての検証済みデータセット上で最先端のResNet-101ベースのセグメンテーションモデルよりも優れています。
論文 参考訳(メタデータ) (2021-01-19T03:08:03Z) - Channel-wise Knowledge Distillation for Dense Prediction [73.99057249472735]
本稿では,学生ネットワークと教師ネットワークのチャンネルワイズ機能について提案する。
様々なネットワーク構造を持つ3つのベンチマークにおいて、一貫して優れた性能を実現している。
論文 参考訳(メタデータ) (2020-11-26T12:00:38Z) - Dual Attention GANs for Semantic Image Synthesis [101.36015877815537]
本稿では,写真リアリスティック・セマンティック・一貫性のあるイメージを合成するための新しいデュアルアテンションGAN(DAGAN)を提案する。
また,2つの新しいモジュール,すなわち位置対応空間アテンションモジュール(SAM)と規模対応チャネルアテンションモジュール(CAM)を提案する。
DAGANは、より少ないモデルパラメータを使用しながら、最先端のメソッドよりも驚くほど優れた結果が得られる。
論文 参考訳(メタデータ) (2020-08-29T17:49:01Z) - Adaptive feature recombination and recalibration for semantic
segmentation with Fully Convolutional Networks [57.64866581615309]
完全畳み込みネットワークを用いたセマンティックセグメンテーションに適応した特徴の組換えと空間適応型再分類ブロックを提案する。
その結果、再結合と再校正は競争ベースラインの結果を改善し、3つの異なる問題にまたがって一般化することを示した。
論文 参考訳(メタデータ) (2020-06-19T15:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。