論文の概要: SESS: Saliency Enhancing with Scaling and Sliding
- arxiv url: http://arxiv.org/abs/2207.01769v1
- Date: Tue, 5 Jul 2022 02:16:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 15:00:38.513914
- Title: SESS: Saliency Enhancing with Scaling and Sliding
- Title(参考訳): SESS: スケーリングとスライディングによるSaliency Enhancing
- Authors: Osman Tursun, Simon Denman, Sridha Sridharan and Clinton Fookes
- Abstract要約: 説明可能なAIや弱い教師付きオブジェクト検出とセグメンテーションを含む、いくつかの機械学習応用領域において、高品質な唾液マップが不可欠である。
SESS (Saliency Enhancing with Scaling and Sliding) と呼ばれる新しいサリエンシ向上手法を提案する。
これは既存のサリエンシマップ生成方法へのメソッドおよびモデル拡張である。
- 参考スコア(独自算出の注目度): 42.188013259368766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-quality saliency maps are essential in several machine learning
application areas including explainable AI and weakly supervised object
detection and segmentation. Many techniques have been developed to generate
better saliency using neural networks. However, they are often limited to
specific saliency visualisation methods or saliency issues. We propose a novel
saliency enhancing approach called SESS (Saliency Enhancing with Scaling and
Sliding). It is a method and model agnostic extension to existing saliency map
generation methods. With SESS, existing saliency approaches become robust to
scale variance, multiple occurrences of target objects, presence of distractors
and generate less noisy and more discriminative saliency maps. SESS improves
saliency by fusing saliency maps extracted from multiple patches at different
scales from different areas, and combines these individual maps using a novel
fusion scheme that incorporates channel-wise weights and spatial weighted
average. To improve efficiency, we introduce a pre-filtering step that can
exclude uninformative saliency maps to improve efficiency while still enhancing
overall results. We evaluate SESS on object recognition and detection
benchmarks where it achieves significant improvement. The code is released
publicly to enable researchers to verify performance and further development.
Code is available at: https://github.com/neouyghur/SESS
- Abstract(参考訳): 説明可能なAIや弱い教師付きオブジェクト検出とセグメンテーションを含む、いくつかの機械学習応用領域において、高品質な唾液マップが不可欠である。
ニューラルネットワークを用いてより優れたサリエンシを生成するために、多くの技術が開発されている。
しかし、それらはしばしば特定のサリエンシーの可視化方法やサリエンシーの問題に限定される。
本稿では,SESS (Saliency Enhancing with Scaling and Sliding) と呼ばれる新しいサリエンシ向上手法を提案する。
既存のサリエンシーマップ生成メソッドへのメソッドとモデルに依存しない拡張である。
SESSでは、既存のサリエンシアプローチは、分散のスケール、ターゲットオブジェクトの複数発生、イントラクタの存在、ノイズの低減とより差別的なサリエンシマップを生成する。
SESSは、異なる領域から異なるスケールで複数のパッチから抽出されたサリエンシマップを融合させることにより、サリエンシを改善し、チャネルワイドと空間重み付き平均を組み込んだ新しい融合スキームを用いてこれらの個々のマップを組み合わせる。
効率を向上するため,不定形サリエンシマップを除外し,効率を向上すると共に,全体的な結果を向上する前処理手順を導入する。
我々は,オブジェクト認識および検出ベンチマークのsesを評価し,大幅な改善を実現する。
このコードは公開されており、研究者がパフォーマンスとさらなる開発を検証することができる。
コードはhttps://github.com/neouyghur/sessで入手できる。
関連論文リスト
- Unified Gradient-Based Machine Unlearning with Remain Geometry Enhancement [29.675650285351768]
深層ニューラルネットワークのプライバシーと信頼性を高めるために、機械学習(MU)が登場した。
近似MUは大規模モデルの実用的手法である。
本稿では,最新の学習方向を暗黙的に近似する高速スローパラメータ更新手法を提案する。
論文 参考訳(メタデータ) (2024-09-29T15:17:33Z) - Rethinking Class Activation Maps for Segmentation: Revealing Semantic
Information in Shallow Layers by Reducing Noise [2.462953128215088]
クラス活性化マップの性能に対する大きな制限は、畳み込みニューラルネットワークの最後の層にある特徴マップの小さな空間分解能である。
本稿では, 雑音を正の勾配で除去し, ノイズを除去する簡易な勾配法を提案する。
提案手法は,他のCAM関連手法にも容易に適用可能であり,高品質なクラスアクティベーションマップの取得が容易である。
論文 参考訳(メタデータ) (2023-08-04T03:04:09Z) - TSG: Target-Selective Gradient Backprop for Probing CNN Visual Saliency [72.9106103283475]
我々は、畳み込みニューラルネットワークを解釈するために視覚的サリエンシ、すなわち視覚的説明について研究する。
これらの観測に触発されて、我々はTSG(Target-Selective Gradient)バックプロップと呼ばれる新しいビジュアル・サリエンシ・フレームワークを提案する。
提案したTSGはTSG-ConvとTSG-FCの2つのコンポーネントから構成され、それぞれ畳み込み層と完全連結層の勾配を補正する。
論文 参考訳(メタデータ) (2021-10-11T12:00:20Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。