論文の概要: On the Post-hoc Explainability of Deep Echo State Networks for Time
Series Forecasting, Image and Video Classification
- arxiv url: http://arxiv.org/abs/2102.08634v1
- Date: Wed, 17 Feb 2021 08:56:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-18 14:51:36.851616
- Title: On the Post-hoc Explainability of Deep Echo State Networks for Time
Series Forecasting, Image and Video Classification
- Title(参考訳): 時系列予測・画像・映像分類のための深部エコー状態ネットワークのポストホックな説明可能性について
- Authors: Alejandro Barredo Arrieta, Sergio Gil-Lopez, Ibai La\~na, Miren Nekane
Bilbao, Javier Del Ser
- Abstract要約: エコー状態ネットワークは、主に学習アルゴリズムの単純さと計算効率のために、時間を通じて多くのスターを惹きつけてきた。
本研究では,時間系列,画像,映像データを用いた学習タスクに適用した場合のエコー状態ネットワークの説明可能性について検討した。
本研究では,これらの反復モデルが把握した知識に関する理解可能な情報を抽出する3つの手法を提案する。
- 参考スコア(独自算出の注目度): 63.716247731036745
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Since their inception, learning techniques under the Reservoir Computing
paradigm have shown a great modeling capability for recurrent systems without
the computing overheads required for other approaches. Among them, different
flavors of echo state networks have attracted many stares through time, mainly
due to the simplicity and computational efficiency of their learning algorithm.
However, these advantages do not compensate for the fact that echo state
networks remain as black-box models whose decisions cannot be easily explained
to the general audience. This work addresses this issue by conducting an
explainability study of Echo State Networks when applied to learning tasks with
time series, image and video data. Specifically, the study proposes three
different techniques capable of eliciting understandable information about the
knowledge grasped by these recurrent models, namely, potential memory, temporal
patterns and pixel absence effect. Potential memory addresses questions related
to the effect of the reservoir size in the capability of the model to store
temporal information, whereas temporal patterns unveils the recurrent
relationships captured by the model over time. Finally, pixel absence effect
attempts at evaluating the effect of the absence of a given pixel when the echo
state network model is used for image and video classification. We showcase the
benefits of our proposed suite of techniques over three different domains of
applicability: time series modeling, image and, for the first time in the
related literature, video classification. Our results reveal that the proposed
techniques not only allow for a informed understanding of the way these models
work, but also serve as diagnostic tools capable of detecting issues inherited
from data (e.g. presence of hidden bias).
- Abstract(参考訳): その開始以来、貯水池コンピューティングパラダイムの下での学習技術は、他のアプローチに必要な計算オーバーヘッドなしに、リカレントシステムのための優れたモデリング能力を示してきた。
それらのうち、エコー状態ネットワークの様々なフレーバーは、学習アルゴリズムの単純さと計算効率のために、時間を通じて多くのスターを惹きつけてきた。
しかし、これらの利点は、エコー状態ネットワークが一般的な聴衆に容易に説明できないブラックボックスモデルのままであるという事実を補うものではない。
本研究では,時間系列,画像,映像データを用いた学習タスクに適用した場合のエコー状態ネットワークの説明可能性について検討した。
具体的には,これら再帰モデルが把握する知識,すなわち潜在記憶,時間パターン,画素欠落効果について理解可能な情報を抽出できる3つの手法を提案する。
潜在的なメモリは、時間的情報を格納するモデルの能力における貯水池のサイズの影響に関連する問題に対処する一方、時間的パターンは、モデルが経時的に捉えた反復関係を明らかにする。
最後に、ピクセル不在効果は、画像およびビデオ分類にエコー状態ネットワークモデルを使用する場合、与えられたピクセル不在の効果を評価することを試みます。
時系列モデリング、画像、および関連する文献、ビデオ分類で初めて、適用可能性の3つの異なるドメインで提案された一連の技術の利点を紹介します。
以上の結果から,提案手法は,これらのモデルの動作方法の理解だけでなく,データから受け継がれた問題を検出する診断ツールとしても機能することが明らかとなった。
隠された偏見の存在)。
関連論文リスト
- PointMoment:Mixed-Moment-based Self-Supervised Representation Learning
for 3D Point Clouds [11.980787751027872]
我々は,ポイントクラウドによる自己教師型表現学習のための新しいフレームワークであるPointMomentを提案する。
我々のフレームワークは、非対称ネットワークアーキテクチャや勾配停止など特別な技術を必要としない。
論文 参考訳(メタデータ) (2023-12-06T08:49:55Z) - Differentiable Outlier Detection Enable Robust Deep Multimodal Analysis [20.316056261749946]
本稿では,明示的な知識グラフを取り入れたエンドツーエンドのビジョンと言語モデルを提案する。
また,暗黙的ネットワーク演算子を用いた対話型アウト・オブ・ディストリビューション・レイヤを導入する。
実際に,視覚的質問応答,視覚的推論,画像テキスト検索など,複数の視覚および言語下流タスクにモデルを適用した。
論文 参考訳(メタデータ) (2023-02-11T05:46:21Z) - From Actions to Events: A Transfer Learning Approach Using Improved Deep
Belief Networks [1.0554048699217669]
本稿では,エネルギーモデルを用いた行動認識からイベント認識への知識マッピング手法を提案する。
このようなモデルはすべてのフレームを同時に処理し、学習プロセスを通じて空間的および時間的情報を運ぶことができる。
論文 参考訳(メタデータ) (2022-11-30T14:47:10Z) - CONVIQT: Contrastive Video Quality Estimator [63.749184706461826]
知覚ビデオ品質評価(VQA)は、多くのストリーミングおよびビデオ共有プラットフォームにおいて不可欠な要素である。
本稿では,視覚的に関連のある映像品質表現を自己指導的に学習する問題について考察する。
本研究は, 自己教師型学習を用いて, 知覚力による説得力のある表現が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T15:22:01Z) - STIP: A SpatioTemporal Information-Preserving and Perception-Augmented
Model for High-Resolution Video Prediction [78.129039340528]
本稿では、上記の2つの問題を解決するために、時空間情報保存・知覚拡張モデル(STIP)を提案する。
提案モデルは,特徴抽出と状態遷移中の映像の時間的情報を保存することを目的としている。
実験結果から,提案したSTIPは,様々な最先端手法と比較して,より良好な映像品質で映像を予測できることが示唆された。
論文 参考訳(メタデータ) (2022-06-09T09:49:04Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Efficient Modelling Across Time of Human Actions and Interactions [92.39082696657874]
3つの畳み込みニューラルネットワーク(CNND)における現在の固定サイズの時間的カーネルは、入力の時間的変動に対処するために改善できると主張している。
我々は、アーキテクチャの異なるレイヤにまたがる機能の違いを強化することで、アクションのクラス間でどのようにうまく対処できるかを研究する。
提案手法は、いくつかのベンチマークアクション認識データセットで評価され、競合する結果を示す。
論文 参考訳(メタデータ) (2021-10-05T15:39:11Z) - Understanding invariance via feedforward inversion of discriminatively
trained classifiers [30.23199531528357]
過去の研究では、出力ログに余計な視覚的詳細が残っていることが判明した。
極めて高い忠実度を再現するフィードフォワードインバージョンモデルを開発する。
私たちのアプローチはBigGANをベースにしており、1ホットクラスのラベルの代わりにロジットのコンディショニングを行います。
論文 参考訳(メタデータ) (2021-03-15T17:56:06Z) - Collaborative Distillation in the Parameter and Spectrum Domains for
Video Action Recognition [79.60708268515293]
本稿では,行動認識のための小型かつ効率的なネットワークの訓練方法について検討する。
周波数領域における2つの蒸留戦略,すなわち特徴スペクトルとパラメータ分布蒸留を提案する。
提案手法は,同じバックボーンを持つ最先端の手法よりも高い性能を実現することができる。
論文 参考訳(メタデータ) (2020-09-15T07:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。