論文の概要: Statistical Attention Localization (SAL): Methodology and Application to
Object Classification
- arxiv url: http://arxiv.org/abs/2208.01823v1
- Date: Wed, 3 Aug 2022 02:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 13:35:38.875002
- Title: Statistical Attention Localization (SAL): Methodology and Application to
Object Classification
- Title(参考訳): 統計的注意定位法(SAL)の方法論と対象分類への応用
- Authors: Yijing Yang, Vasileios Magoulianitis, Xinyu Wang and C.-C. Jay Kuo
- Abstract要約: 対象分類作業を容易にするため,SAL法を提案する。
SALは,(1)決定統計による事前注意ウィンドウの選択,(2)注意マップの改良,3)長方形の注意領域のファイナライゼーションの3段階からなる。
- 参考スコア(独自算出の注目度): 30.25893467198416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A statistical attention localization (SAL) method is proposed to facilitate
the object classification task in this work. SAL consists of three steps: 1)
preliminary attention window selection via decision statistics, 2) attention
map refinement, and 3) rectangular attention region finalization. SAL computes
soft-decision scores of local squared windows and uses them to identify salient
regions in Step 1. To accommodate object of various sizes and shapes, SAL
refines the preliminary result and obtain an attention map of more flexible
shape in Step 2. Finally, SAL yields a rectangular attention region using the
refined attention map and bounding box regularization in Step 3. As an
application, we adopt E-PixelHop, which is an object classification solution
based on successive subspace learning (SSL), as the baseline. We apply SAL so
as to obtain a cropped-out and resized attention region as an alternative
input. Classification results of the whole image as well as the attention
region are ensembled to achieve the highest classification accuracy.
Experiments on the CIFAR-10 dataset are given to demonstrate the advantage of
the SAL-assisted object classification method.
- Abstract(参考訳): 本研究における対象物分類作業を容易にするために,統計的注意定位法(sal)を提案する。
SALは3つのステップから構成される。
1)決定統計による事前注意窓の選択
2)注意地図の精巧化、及び
3) 矩形注意領域最終化。
SALは局所四角い窓の柔らかい決定スコアを計算し、それらをステップ内の健全な領域を特定する
1.様々な大きさ・形状の物体に対応するため、SALは予備結果を洗練し、ステップ内のより柔軟な形状の注意マップを得る。
2最後にSALは、改良された注目マップとステップのバウンディングボックス正規化を用いて長方形の注意領域を得る
3.アプリケーションとして,逐次サブスペース学習(SSL)に基づくオブジェクト分類ソリューションであるE-PixelHopをベースラインとして採用する。
代替入力として,クロッピングアウトおよびリサイズアテンション領域を得るために,salを適用する。
画像全体および注意領域の分類結果を合理化し、最高分類精度を達成する。
CIFAR-10データセットの実験を行い、SAL支援対象分類法の利点を実証した。
関連論文リスト
- SCE-MAE: Selective Correspondence Enhancement with Masked Autoencoder for Self-Supervised Landmark Estimation [20.29438820908913]
自己監督的ランドマーク推定は、局所的な特徴表現の形成を要求する困難なタスクである。
本稿では,高価なハイパーカラムではなく,バニラ特徴マップ上で動作するフレームワークであるSCE-MAEを紹介する。
我々は,SCE-MAEが高効率で頑健であり,既存のSOTA法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2024-05-28T16:14:10Z) - FIT-SLAM -- Fisher Information and Traversability estimation-based
Active SLAM for exploration in 3D environments [1.4474137122906163]
アクティブビジュアルSLAMは、地上ロボットのためのデニッドサブテレイン環境と屋外環境における幅広い応用を見出す。
探索ミッション中に目標選択と目標に向けた経路計画に知覚的考察を取り入れることが不可欠である。
本研究では,無人地上車両(UGV)を対象とした新しい探査手法であるFIT-SLAMを提案する。
論文 参考訳(メタデータ) (2024-01-17T16:46:38Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Adaptive Region Selection for Active Learning in Whole Slide Image
Semantic Segmentation [3.1392713791311766]
リージョンベースアクティブラーニング(AL)では、限られた数の注釈付き画像領域でモデルをトレーニングする。
本稿では,このALハイパーパラメータに依存しないアノテーション領域を適応的に選択する手法を提案する。
CAMELYON16データセットを用いた乳癌セグメンテーションの課題を用いて本手法の評価を行った。
論文 参考訳(メタデータ) (2023-07-14T05:34:13Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - Learning Where to Learn in Cross-View Self-Supervised Learning [54.14989750044489]
自己教師付き学習(SSL)は大きな進歩を遂げ、教師付き学習との大きなギャップを狭めた。
現在の方法では、埋め込みにピクセルの統一的なアグリゲーションを採用する。
本稿では,特徴の空間情報を適応的に集約する学習方法であるLearning Where to Learn(LEWEL)を提案する。
論文 参考訳(メタデータ) (2022-03-28T17:02:42Z) - Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。
本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-20T17:56:47Z) - Consistency-based Active Learning for Object Detection [10.794744492493262]
アクティブラーニングは、限られた予算で最も情報に富んだサンプルを選択することで、タスクモデルの性能を向上させることを目的としている。
本研究では,オリジナルデータと拡張データとの一貫性を十分に探究する,オブジェクト検出のための効果的な一貫性に基づくアクティブラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T17:00:34Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z) - InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic
Information Modeling [65.47126868838836]
動的情報モデリングを用いた新しい3次元オブジェクト検出フレームワークを提案する。
粗い予測は、ボクセルベースの領域提案ネットワークを介して第1段階で生成される。
大規模なnuScenes 3D検出ベンチマークで実験を行った。
論文 参考訳(メタデータ) (2020-07-16T18:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。