論文の概要: Attribution in Scale and Space
- arxiv url: http://arxiv.org/abs/2004.03383v2
- Date: Wed, 8 Apr 2020 16:41:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 03:44:45.376924
- Title: Attribution in Scale and Space
- Title(参考訳): 規模と空間における帰属
- Authors: Shawn Xu, Subhashini Venugopalan, Mukund Sundararajan
- Abstract要約: 本稿では,emphBlur 統合勾配法という新しい手法を提案する。
ネットワークがオブジェクトを認識するスケールを判断できる。
スケールや周波数の次元でスコアを生成し、興味深い現象を捉えます。
- 参考スコア(独自算出の注目度): 16.384114361783766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the attribution problem [28] for deep networks applied to perception
tasks. For vision tasks, attribution techniques attribute the prediction of a
network to the pixels of the input image. We propose a new technique called
\emph{Blur Integrated Gradients}. This technique has several advantages over
other methods. First, it can tell at what scale a network recognizes an object.
It produces scores in the scale/frequency dimension, that we find captures
interesting phenomena. Second, it satisfies the scale-space axioms [14], which
imply that it employs perturbations that are free of artifact. We therefore
produce explanations that are cleaner and consistent with the operation of deep
networks. Third, it eliminates the need for a 'baseline' parameter for
Integrated Gradients [31] for perception tasks. This is desirable because the
choice of baseline has a significant effect on the explanations. We compare the
proposed technique against previous techniques and demonstrate application on
three tasks: ImageNet object recognition, Diabetic Retinopathy prediction, and
AudioSet audio event identification.
- Abstract(参考訳): 知覚課題に適用した深層ネットワークの帰属問題 [28] について検討した。
視覚タスクでは、属性技術は入力画像のピクセルにネットワークの予測を関連付ける。
そこで我々は,emph{blur integrated gradients} と呼ばれる新しい手法を提案する。
この手法は他の手法よりもいくつかの利点がある。
まず、ネットワークがどの規模でオブジェクトを認識できるかを判断する。
スケール/周波数次元でスコアを生成し、興味深い現象を捉える。
第二に、スケール空間公理 [14] を満たすことであり、これは人工物のない摂動を用いることを意味する。
したがって、よりクリーンで深いネットワークの操作と整合した説明を生成する。
第3に、知覚タスクのための統合勾配 [31] のための'ベースライン'パラメータの必要性をなくす。
ベースラインの選択が説明に重大な影響を与えるため、これは望ましい。
提案手法を従来の手法と比較し,imagenetオブジェクト認識,糖尿病網膜症予測,オーディオセット音声イベント識別の3つのタスクに適用した。
関連論文リスト
- GP-NeRF: Generalized Perception NeRF for Context-Aware 3D Scene Understanding [101.32590239809113]
Generalized Perception NeRF (GP-NeRF) は、広く使われているセグメンテーションモデルとNeRFを統一されたフレームワークで相互に動作させる新しいパイプラインである。
本稿では,セマンティック蒸留損失(Semantic Distill Loss)とDepth-Guided Semantic Distill Loss(Depth-Guided Semantic Distill Loss)という2つの自己蒸留機構を提案する。
論文 参考訳(メタデータ) (2023-11-20T15:59:41Z) - Exploring Geometry of Blind Spots in Vision Models [56.47644447201878]
CNNやトランスフォーマーのような視覚モデルにおける過敏性の現象について検討する。
本稿では,入力空間に対する信頼度の高い領域を反復的に探索するレベルセットトラバースアルゴリズムを提案する。
モデルが高い信頼度を維持するこれらの連結高次元領域の範囲を推定する。
論文 参考訳(メタデータ) (2023-10-30T18:00:33Z) - Stochastic Surprisal: An inferential measurement of Free Energy in
Neural Networks [18.32369721322249]
本稿では、教師付きニューラルネットワークにおける推論中の動作を可能にするフレームワークを推測し、検証する。
本稿では,ネットワーク,入力,および可能な動作の関数であるsusprisalと呼ばれる新しい測定方法を提案する。
ノイズ特性は頑健な認識のために無視されるが、品質スコアを推定するために分析されることが示されている。
論文 参考訳(メタデータ) (2023-02-11T20:41:05Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Detecting Adversarial Perturbations in Multi-Task Perception [32.9951531295576]
本稿では,複雑な視覚タスクのマルチタスク認識に基づく,新たな対向摂動検出手法を提案する。
入力画像の抽出されたエッジと深度出力とセグメンテーション出力との不整合により、逆摂動を検出する。
5%の偽陽性率を仮定すると、画像の最大100%は逆摂動として正しく検出され、摂動の強さに依存する。
論文 参考訳(メタデータ) (2022-03-02T15:25:17Z) - Self-Guided Instance-Aware Network for Depth Completion and Enhancement [6.319531161477912]
既存の手法では,画素ワイド画像の内容とそれに対応する近傍の深度値に基づいて,欠落した深度測定を直接補間する。
本稿では、自己誘導機構を利用して、深度復元に必要なインスタンスレベルの特徴を抽出する自己誘導型インスタンス認識ネットワーク(SG-IANet)を提案する。
論文 参考訳(メタデータ) (2021-05-25T19:41:38Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - Implicit Saliency in Deep Neural Networks [15.510581400494207]
本稿では,既存の認識と局所化の深部構造が人間の視覚的正当性を予測できることを示す。
予測ミスマッチ仮説を教師なし方式で計算し,その暗黙の正当性を計算する。
実験の結果,この方法での塩分濃度の抽出は,最先端の教師付きアルゴリズムに対して測定した場合と同等の性能を示すことがわかった。
論文 参考訳(メタデータ) (2020-08-04T23:14:24Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z) - Reproduction of Lateral Inhibition-Inspired Convolutional Neural Network
for Visual Attention and Saliency Detection [0.0]
ニューラルネットワークは 自然画像の例と 効果的に混同されます
対象の分類は,対象が位置する背景画素の影響を強く受けているのではないかと思う。
この目的のために,licNNネットワークが作成した有能度マップを用いて,上記の問題を解析する。
論文 参考訳(メタデータ) (2020-05-05T13:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。