論文の概要: Spatially Attentive Output Layer for Image Classification
- arxiv url: http://arxiv.org/abs/2004.07570v1
- Date: Thu, 16 Apr 2020 10:11:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 21:46:49.701108
- Title: Spatially Attentive Output Layer for Image Classification
- Title(参考訳): 画像分類のための空間的注意出力層
- Authors: Ildoo Kim, Woonhyuk Baek, Sungwoong Kim
- Abstract要約: 画像分類のためのほとんどの畳み込みニューラルネットワーク(CNN)は、グローバル平均プーリング(GAP)と、出力ロジットのための完全連結(FC)層を使用する。
本稿では,既存の畳み込み特徴マップ上に新しい空間出力層を提案し,位置固有出力情報を明示的に活用する。
- 参考スコア(独自算出の注目度): 19.61612493183965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most convolutional neural networks (CNNs) for image classification use a
global average pooling (GAP) followed by a fully-connected (FC) layer for
output logits. However, this spatial aggregation procedure inherently restricts
the utilization of location-specific information at the output layer, although
this spatial information can be beneficial for classification. In this paper,
we propose a novel spatial output layer on top of the existing convolutional
feature maps to explicitly exploit the location-specific output information. In
specific, given the spatial feature maps, we replace the previous GAP-FC layer
with a spatially attentive output layer (SAOL) by employing a attention mask on
spatial logits. The proposed location-specific attention selectively aggregates
spatial logits within a target region, which leads to not only the performance
improvement but also spatially interpretable outputs. Moreover, the proposed
SAOL also permits to fully exploit location-specific self-supervision as well
as self-distillation to enhance the generalization ability during training. The
proposed SAOL with self-supervision and self-distillation can be easily plugged
into existing CNNs. Experimental results on various classification tasks with
representative architectures show consistent performance improvements by SAOL
at almost the same computational cost.
- Abstract(参考訳): 画像分類のためのほとんどの畳み込みニューラルネットワーク(CNN)は、グローバル平均プーリング(GAP)と、出力ロジットのための完全連結(FC)層を使用する。
しかし、この空間集約処理は本質的に出力層における位置情報の利用を制限するが、この空間情報は分類に有用である。
本稿では,既存の畳み込み特徴マップ上に新たな空間出力層を配置し,位置特異的な出力情報を明示的に活用する。
具体的には、空間的特徴写像を考慮し、空間ロジットに注意マスクを用いることで、以前のGAP-FC層を空間的注意出力層(SAOL)に置き換える。
提案手法は,目標領域内の空間ロジットを選択的に集約することで,性能向上だけでなく,空間的に解釈可能な出力も実現する。
さらに,提案する saol では, 訓練中の一般化能力を高めるために, 位置特異的な自己スーパービジョンと自己蒸留を十分に活用することができる。
自己スーパービジョンと自己蒸留を備えたSAOLは既存のCNNに簡単に接続できる。
代表アーキテクチャを用いた各種分類タスクの実験結果は、ほぼ同じ計算コストでSAOLによる一貫した性能向上を示す。
関連論文リスト
- Lacunarity Pooling Layers for Plant Image Classification using Texture Analysis [0.38366697175402226]
ポーリング層は、画素強度及び/または特徴値の空間配置に符号化された重要な情報を見渡す。
そこで本研究では,特徴マップの空間的不均一性を,局所窓内における変動性の評価により捉えることを目的とした,新しいラキュナリティプーリング層を提案する。
ラキュナリティプーリング層は、任意の人工ニューラルネットワークアーキテクチャにシームレスに統合することができる。
論文 参考訳(メタデータ) (2024-04-25T00:34:52Z) - Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - SSPNet: Scale and Spatial Priors Guided Generalizable and Interpretable
Pedestrian Attribute Recognition [23.55622798950833]
Pedestrian Attribute Recognition(PAR)モデルに対して,SSPNet(Scale and Spatial Priors Guided Network)を提案する。
SSPNetは、異なる属性グループに対して適切なスケールの事前情報を提供することを学び、モデルが異なるレベルの機能マップに集中できるようにする。
Weakly-supervised Pedestrian Attribute Localization (WPAL) に対して, 属性応答マスクのGrad-CAMの改良に基づく新しいIoU属性ローカライゼーション指標を提案する。
論文 参考訳(メタデータ) (2023-12-11T00:41:40Z) - Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。
実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-03-18T15:38:17Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z) - Learning to Predict Context-adaptive Convolution for Semantic
Segmentation [66.27139797427147]
長距離コンテキスト情報は、高性能なセマンティックセグメンテーションを実現するために不可欠である。
空間的に変化する特徴重み付けベクトルを予測するためのコンテキスト適応畳み込みネットワーク(CaC-Net)を提案する。
当社のCaC-Netは,3つの公開データセット上でのセグメンテーション性能に優れています。
論文 参考訳(メタデータ) (2020-04-17T13:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。