論文の概要: EchoVPR: Echo State Networks for Visual Place Recognition
- arxiv url: http://arxiv.org/abs/2110.05572v1
- Date: Mon, 11 Oct 2021 19:25:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 08:37:35.347749
- Title: EchoVPR: Echo State Networks for Visual Place Recognition
- Title(参考訳): echovpr: 視覚位置認識のためのecho state networks
- Authors: Anil Ozdemir, Andrew B. Barron, Andrew Philippides, Michael Mangan,
Eleni Vasilaki, Luca Manneschi
- Abstract要約: 一連のESNを提示し、それらのVPR問題への適用性について分析する。
ESNは、データのシーケンシャルなダイナミクスを利用するクラスリード型VPRモデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.8155575318208631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognising previously visited locations is an important, but unsolved, task
in autonomous navigation. Current visual place recognition (VPR) benchmarks
typically challenge models to recover the position of a query image (or images)
from sequential datasets that include both spatial and temporal components.
Recently, Echo State Network (ESN) varieties have proven particularly powerful
at solving machine learning tasks that require spatio-temporal modelling. These
networks are simple, yet powerful neural architectures that -- exhibiting
memory over multiple time-scales and non-linear high-dimensional
representations -- can discover temporal relations in the data while still
maintaining linearity in the learning. In this paper, we present a series of
ESNs and analyse their applicability to the VPR problem. We report that the
addition of ESNs to pre-processed convolutional neural networks led to a
dramatic boost in performance in comparison to non-recurrent networks in four
standard benchmarks (GardensPoint, SPEDTest, ESSEX3IN1, Nordland) demonstrating
that ESNs are able to capture the temporal structure inherent in VPR problems.
Moreover, we show that ESNs can outperform class-leading VPR models which also
exploit the sequential dynamics of the data. Finally, our results demonstrate
that ESNs also improve generalisation abilities, robustness, and accuracy
further supporting their suitability to VPR applications.
- Abstract(参考訳): 以前訪れた場所を認識することは、自律的なナビゲーションにおいて重要だが未解決のタスクである。
現在の視覚的位置認識(VPR)ベンチマークは、通常、空間的コンポーネントと時間的コンポーネントの両方を含むシーケンシャルデータセットからクエリ画像(または画像)の位置を復元するモデルに挑戦する。
最近、Echo State Network(ESN)の変種は、時空間モデリングを必要とする機械学習タスクの解決に特に強力であることが証明されている。
これらのネットワークはシンプルだが強力なニューラルネットワークであり、複数の時間スケールと非線形の高次元表現に記憶を示すことによって、学習の線形性を維持しながら、データの時間的関係を発見できる。
本稿では,一連のESNを提示し,そのVPR問題への適用性について分析する。
我々は、前処理された畳み込みニューラルネットワークへのESNの追加が、4つの標準ベンチマーク(GardensPoint, SPEDTest, ESSEX3IN1, Nordland)の非リカレントネットワークと比較して劇的な性能向上につながったことを報告した。
さらに、ESNは、データのシーケンシャルなダイナミクスを利用するクラスリード型VPRモデルよりも優れていることを示す。
最後に, ESNは一般化能力, 堅牢性, 精度も向上し, VPRアプリケーションへの適合性も向上することを示した。
関連論文リスト
- Deep Learning Approaches for Human Action Recognition in Video Data [0.8080830346931087]
本研究は、この課題に対処するために、様々なディープラーニングモデルの詳細な分析を行う。
我々は、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)、Two-Stream ConvNetsに焦点を当てる。
本研究の結果は,頑健な人間の行動認識を実現するための複合モデルの可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-03-11T15:31:25Z) - How neural networks learn to classify chaotic time series [77.34726150561087]
本研究では,通常の逆カオス時系列を分類するために訓練されたニューラルネットワークの内部動作について検討する。
入力周期性とアクティベーション周期の関係は,LKCNNモデルの性能向上の鍵となる。
論文 参考訳(メタデータ) (2023-06-04T08:53:27Z) - Deep Learning Architectures for FSCV, a Comparison [0.0]
適合性は、"out-of-probe"の場合の予測性能、人工的に誘導される電気ノイズに対する応答、与えられたプローブに対してモデルがいつ不完全になるかを予測する能力によって決定される。
深い畳み込みニューラルネットワークであるInceptionTimeアーキテクチャは、テストされたモデルの最高の絶対的な予測性能を持つが、ノイズの影響を受けやすい。
単純多層型パーセプトロンアーキテクチャは2番目に低い予測誤差を有しており、人工ノイズの影響を受けていないため、畳み込みは疑わしいほど重要でない可能性がある。
論文 参考訳(メタデータ) (2022-12-05T00:20:10Z) - Spiking Neural Networks for event-based action recognition: A new task to understand their advantage [1.4348901037145936]
スパイキングニューラルネットワーク(SNN)は、そのユニークな時間的ダイナミクスによって特徴づけられる。
フィードフォワードニューラルネットワークにおいて、スパイキングニューロンが時間的特徴抽出を可能にする方法を示す。
また、繰り返しSNNがLSTMに匹敵する結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-29T16:22:46Z) - The Spectral Bias of Polynomial Neural Networks [63.27903166253743]
PNN(Polynomial Neural Network)は、高頻度情報を重要視する画像生成と顔認識に特に有効であることが示されている。
これまでの研究では、ニューラルネットワークが低周波関数に対して$textitspectral bias$を示しており、トレーニング中に低周波成分のより高速な学習をもたらすことが示されている。
このような研究に触発されて、我々はPNNのTangent Kernel(NTK)のスペクトル分析を行う。
我々は、最近提案されたPNNのパラメトリゼーションである$Pi$-Netファミリがスピードアップすることを発見した。
論文 参考訳(メタデータ) (2022-02-27T23:12:43Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - A journey in ESN and LSTM visualisations on a language task [77.34726150561087]
我々は,CSL(Cross-Situationnal Learning)タスクでESNとLSTMを訓練した。
その結果, 性能比較, 内部力学解析, 潜伏空間の可視化の3種類が得られた。
論文 参考訳(メタデータ) (2020-12-03T08:32:01Z) - Graph Neural Networks for Leveraging Industrial Equipment Structure: An
application to Remaining Useful Life Estimation [21.297461316329453]
本稿では,複雑な機器の構造をグラフ形式で把握し,マルチセンサ時系列データをモデル化するためにグラフニューラルネットワーク(GNN)を用いる。
我々は,提案したGNNに基づくRUL推定モデルが,RNNやCNNをベースとした文学からの強いベースラインと好意的に比較した。
論文 参考訳(メタデータ) (2020-06-30T06:38:08Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z) - Deep Speaker Embeddings for Far-Field Speaker Recognition on Short
Utterances [53.063441357826484]
深層話者埋め込みに基づく話者認識システムは,制御条件下での大幅な性能向上を実現している。
制御されていない雑音環境下での短い発話に対する話者検証は、最も困難で要求の高いタスクの1つである。
本稿では,a)環境騒音の有無による遠距離話者検証システムの品質向上,b)短時間発話におけるシステム品質劣化の低減という2つの目標を達成するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-14T13:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。