論文の概要: Implicit Saliency in Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2008.01874v1
- Date: Tue, 4 Aug 2020 23:14:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 23:19:59.485035
- Title: Implicit Saliency in Deep Neural Networks
- Title(参考訳): 深部ニューラルネットワークにおけるインシシタンス
- Authors: Yutong Sun, Mohit Prabhushankar and Ghassan AlRegib
- Abstract要約: 本稿では,既存の認識と局所化の深部構造が人間の視覚的正当性を予測できることを示す。
予測ミスマッチ仮説を教師なし方式で計算し,その暗黙の正当性を計算する。
実験の結果,この方法での塩分濃度の抽出は,最先端の教師付きアルゴリズムに対して測定した場合と同等の性能を示すことがわかった。
- 参考スコア(独自算出の注目度): 15.510581400494207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we show that existing recognition and localization deep
architectures, that have not been exposed to eye tracking data or any saliency
datasets, are capable of predicting the human visual saliency. We term this as
implicit saliency in deep neural networks. We calculate this implicit saliency
using expectancy-mismatch hypothesis in an unsupervised fashion. Our
experiments show that extracting saliency in this fashion provides comparable
performance when measured against the state-of-art supervised algorithms.
Additionally, the robustness outperforms those algorithms when we add large
noise to the input images. Also, we show that semantic features contribute more
than low-level features for human visual saliency detection.
- Abstract(参考訳): 本稿では,眼球追跡データやサリエンシーデータセットに露出していない既存の認識と局所化の深層アーキテクチャが,人間の視覚的サリエンシーを予測することができることを示す。
これをディープニューラルネットワークにおける暗黙の敬礼と呼ぶ。
我々は、予測ミスマッチ仮説を教師なしの方法で計算する。
実験の結果, この方法での塩分抽出は, 最先端の教師付きアルゴリズムに比較して, 同等の性能をもたらすことがわかった。
さらに、入力画像に大きなノイズを加えると、ロバスト性はこれらのアルゴリズムよりも優れる。
また,人間の視覚塩分検出のための低レベル機能以上の意味的特徴を示す。
関連論文リスト
- Exploring Geometry of Blind Spots in Vision Models [56.47644447201878]
CNNやトランスフォーマーのような視覚モデルにおける過敏性の現象について検討する。
本稿では,入力空間に対する信頼度の高い領域を反復的に探索するレベルセットトラバースアルゴリズムを提案する。
モデルが高い信頼度を維持するこれらの連結高次元領域の範囲を推定する。
論文 参考訳(メタデータ) (2023-10-30T18:00:33Z) - How deep convolutional neural networks lose spatial information with
training [0.7328100870402177]
画像の微分同相性に対する安定性は, 前半の空間プール, 後半のチャネルプールによって達成されることを示す。
ノイズに対する感度の上昇は、ReLUユニットによって修正された後、プール中に発生する摂動騒音によるものである。
論文 参考訳(メタデータ) (2022-10-04T10:21:03Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - On the Sins of Image Synthesis Loss for Self-supervised Depth Estimation [60.780823530087446]
画像合成の改善は深度推定の改善を必要としないことを示す。
この発散現象は、データから生じるアレラトリックな不確実性に起因している。
この観察された発散は、以前に報告されたり、深く研究されたりしていない。
論文 参考訳(メタデータ) (2021-09-13T17:57:24Z) - Understanding Character Recognition using Visual Explanations Derived
from the Human Visual System and Deep Networks [6.734853055176694]
深層ニューラルネットワークの情報収集戦略における合同性,あるいはその欠如について検討する。
深層学習モデルは、人間が正しく分類された文字に対して固定した文字の類似した領域を考慮に入れた。
本稿では、視線追跡実験から得られた視覚的固定マップを、モデルが関連する文字領域に焦点を合わせるための監督入力として用いることを提案する。
論文 参考訳(メタデータ) (2021-08-10T10:09:37Z) - Deep Feature Tracker: A Novel Application for Deep Convolutional Neural
Networks [0.0]
本稿では,特徴を確実に追跡する方法を学習できる,新しい,統合されたディープラーニングベースのアプローチを提案する。
Deep-PTと呼ばれる提案ネットワークは、畳み込みニューラルネットワークの相互相関であるトラッカーネットワークで構成されている。
ネットワークは、特徴追跡データセットに特別なデータセットがないため、複数のデータセットを使用してトレーニングされている。
論文 参考訳(メタデータ) (2021-07-30T23:24:29Z) - Predicting Depth from Semantic Segmentation using Game Engine Dataset [0.0]
この論文は、物体の知覚と深度推定畳み込みニューラルネットワークの関係を考察する。
入力時に1つの画像のみを使用する単純な深度推定ネットワークに基づく新しいネットワーク構造を開発した。
その結果,新しい構造は距離の相対誤差の52%で深度推定の性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-06-12T10:15:40Z) - Leveraging Sparse Linear Layers for Debuggable Deep Networks [86.94586860037049]
学習した深い特徴表現に疎い線形モデルを適用することで、よりデバッグ可能なニューラルネットワークを実現する方法を示す。
その結果、スパースな説明は、スプリアス相関を特定し、誤分類を説明し、視覚および言語タスクにおけるモデルバイアスを診断するのに役立ちます。
論文 参考訳(メタデータ) (2021-05-11T08:15:25Z) - Calibrating Self-supervised Monocular Depth Estimation [77.77696851397539]
近年、ニューラルネットワークが深度を学習し、画像のシーケンスに変化を起こさせる能力を示す方法は、訓練信号として自己スーパービジョンのみを使用している。
カメラの構成や環境に関する事前情報を取り入れることで,センサの追加に頼ることなく,自己教師型定式化を用いて,スケールのあいまいさを排除し,深度を直接予測できることを示す。
論文 参考訳(メタデータ) (2020-09-16T14:35:45Z) - Interpretation of Deep Temporal Representations by Selective
Visualization of Internally Activated Nodes [24.228613156037532]
深層ニューラルネットワークから学習した時間的表現を可視化する2つの新しいフレームワークを提案する。
我々のアルゴリズムは、高度に活性化された周期を抽出することで、時間的ニューラルネットワークの決定を解釈する。
このようなサブシーケンスをクラスタリングで特徴付け、提案した型と実際のデータの不確実性を計算する。
論文 参考訳(メタデータ) (2020-04-27T01:45:55Z) - DeFeat-Net: General Monocular Depth via Simultaneous Unsupervised
Representation Learning [65.94499390875046]
DeFeat-Netは、クロスドメインの高密度な特徴表現を同時に学習するアプローチである。
提案手法は, 誤差対策を全て10%程度減らすことで, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2020-03-30T13:10:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。