論文の概要: Real-time Classification from Short Event-Camera Streams using
Input-filtering Neural ODEs
- arxiv url: http://arxiv.org/abs/2004.03156v1
- Date: Tue, 7 Apr 2020 06:58:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 22:44:38.465104
- Title: Real-time Classification from Short Event-Camera Streams using
Input-filtering Neural ODEs
- Title(参考訳): 入力フィルタリングニューラルネットワークを用いた短時間イベントカメラストリームからのリアルタイム分類
- Authors: Giorgio Giannone, Asha Anoosheh, Alessio Quaglino, Pierluca D'Oro,
Marco Gallieri, Jonathan Masci
- Abstract要約: イベントベースのカメラは、人間の視覚システムにインスパイアされた、新しくて効率的なセンサーである。
本稿では,DVSカメラからのイベント,強度変化ストリーム,空間座標の直接利用を提案する。
このシーケンスは、新しいエンプレ同期RNN様アーキテクチャ、入力フィルタリングニューラルネットワーク(INODE)の入力として使用される。
- 参考スコア(独自算出の注目度): 17.764474158122038
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event-based cameras are novel, efficient sensors inspired by the human vision
system, generating an asynchronous, pixel-wise stream of data. Learning from
such data is generally performed through heavy preprocessing and event
integration into images. This requires buffering of possibly long sequences and
can limit the response time of the inference system. In this work, we instead
propose to directly use events from a DVS camera, a stream of intensity changes
and their spatial coordinates. This sequence is used as the input for a novel
\emph{asynchronous} RNN-like architecture, the Input-filtering Neural ODEs
(INODE). This is inspired by the dynamical systems and filtering literature.
INODE is an extension of Neural ODEs (NODE) that allows for input signals to be
continuously fed to the network, like in filtering. The approach naturally
handles batches of time series with irregular time-stamps by implementing a
batch forward Euler solver. INODE is trained like a standard RNN, it learns to
discriminate short event sequences and to perform event-by-event online
inference. We demonstrate our approach on a series of classification tasks,
comparing against a set of LSTM baselines. We show that, independently of the
camera resolution, INODE can outperform the baselines by a large margin on the
ASL task and it's on par with a much larger LSTM for the NCALTECH task.
Finally, we show that INODE is accurate even when provided with very few
events.
- Abstract(参考訳): イベントベースのカメラは、人間の視覚システムにインスパイアされた新しい、効率的なセンサーであり、非同期でピクセル単位でデータストリームを生成する。
このようなデータからの学習は一般的に、重い前処理と画像へのイベント統合を通じて行われる。
これはおそらく長いシーケンスのバッファリングを必要とし、推論システムの応答時間を制限できる。
そこで本研究では,DVSカメラからのイベント,強度変化の流れ,空間座標を直接利用することを提案する。
このシーケンスは、新しい 'emph{asynchronous} RNN-like architecture, the Input-filtering Neural ODEs (INODE) の入力として使用される。
これは力学系とフィルタリング文学にインスパイアされている。
INODEはNeural ODE(NODE)の拡張であり、フィルタのように入力信号を連続的にネットワークに供給することができる。
このアプローチは、バッチフォワードオイラーソルバを実装することによって、不規則なタイムスタンプを持つ時系列のバッチを自然に処理する。
INODEは、標準のRNNのようにトレーニングされ、短いイベントシーケンスを識別し、イベントバイイベントオンライン推論を実行することを学ぶ。
我々はLSTMベースラインの集合と比較し,一連の分類課題に対するアプローチを実証する。
カメラの解像度とは独立に、INODE は ASL タスクにおいてベースラインをはるかに上回り、NAALTECH タスクのLSTM と同等であることを示す。
最後に、非常に少ないイベントが提供される場合でも、INODEは正確であることを示す。
関連論文リスト
- Progressive Fourier Neural Representation for Sequential Video
Compilation [75.43041679717376]
連続学習によって動機づけられたこの研究は、シーケンシャルエンコーディングセッションを通じて、複数の複雑なビデオデータに対して、ニューラル暗黙表現を蓄積し、転送する方法を研究する。
本稿では,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という,FFNR(Progressive Fourier Neural Representation)という手法を提案する。
我々は,UVG8/17とDAVIS50のビデオシーケンスベンチマークでPFNR法を検証し,強力な連続学習ベースラインよりも優れた性能向上を実現した。
論文 参考訳(メタデータ) (2023-06-20T06:02:19Z) - Optical flow estimation from event-based cameras and spiking neural
networks [0.4899818550820575]
イベントベースセンサーはスパイキングニューラルネットワーク(SNN)に最適である
教師付きトレーニング後,高密度光フロー推定が可能なU-NetライクなSNNを提案する。
分離可能な畳み込みにより、我々は、合理的に正確な光フロー推定が得られる光モデルを開発することができた。
論文 参考訳(メタデータ) (2023-02-13T16:17:54Z) - HyperTime: Implicit Neural Representation for Time Series [131.57172578210256]
暗黙の神経表現(INR)は、データの正確で解像度に依存しないエンコーディングを提供する強力なツールとして最近登場した。
本稿では、INRを用いて時系列の表現を分析し、再構成精度とトレーニング収束速度の点で異なるアクティベーション関数を比較した。
本稿では,INRを利用して時系列データセット全体の圧縮潜在表現を学習するハイパーネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:05:51Z) - Neural Implicit Dictionary via Mixture-of-Expert Training [111.08941206369508]
ニューラルインシシット辞書(NID)を学習することで、データとトレーニング効率の両方を達成する汎用INRフレームワークを提案する。
我々のNIDは、所望の関数空間にまたがるように調整された座標ベースのImpworksのグループを組み立てる。
実験の結果,NIDは最大98%の入力データで2次元画像や3次元シーンの再現を2桁高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-08T05:07:19Z) - AEGNN: Asynchronous Event-based Graph Neural Networks [54.528926463775946]
イベントベースのグラフニューラルネットワークは、標準のGNNを一般化して、イベントを"進化的"時間グラフとして処理する。
AEGNNは同期入力で容易に訓練でき、テスト時に効率的な「非同期」ネットワークに変換できる。
論文 参考訳(メタデータ) (2022-03-31T16:21:12Z) - Combining Events and Frames using Recurrent Asynchronous Multimodal
Networks for Monocular Depth Prediction [51.072733683919246]
複数のセンサからの非同期および不規則なデータを処理するために、リカレント非同期マルチモーダル(RAM)ネットワークを導入する。
従来のRNNにインスパイアされたRAMネットワークは、非同期に更新され、予測を生成するためにいつでもクエリできる隠れ状態を維持している。
平均深度絶対誤差において,最先端手法を最大30%改善することを示す。
論文 参考訳(メタデータ) (2021-02-18T13:24:35Z) - Multivariate Time Series Classification Using Spiking Neural Networks [7.273181759304122]
スパイクニューラルネットワークは低消費電力を可能にするため注目されている。
本稿では,時系列をスパース時空間スパイクパターンに変換する符号化方式を提案する。
空間時間パターンを分類する学習アルゴリズムも提案する。
論文 参考訳(メタデータ) (2020-07-07T15:24:01Z) - Learning Long-Term Dependencies in Irregularly-Sampled Time Series [16.762335749650717]
連続時間隠れ状態を持つリカレントニューラルネットワーク(RNN)は、不規則サンプリング時系列のモデリングに自然に適合する。
我々は、標準のRNNと同様、この問題の根底にある理由は、トレーニング中に勾配が消滅または爆発することにあることを証明している。
我々は,その時間連続状態からメモリを分離する長寿命メモリ(LSTM)に基づく新しいアルゴリズムを設計することで,その解を提供する。
論文 参考訳(メタデータ) (2020-06-08T08:46:58Z) - Event-Based Angular Velocity Regression with Spiking Networks [51.145071093099396]
スパイキングニューラルネットワーク(SNN)は、数値ではなく時間スパイクとして伝達される情報を処理する。
本稿では,イベントカメラから与えられた事象の時間回帰問題を初めて提案する。
角速度回帰を行うためにSNNをうまく訓練できることが示される。
論文 参考訳(メタデータ) (2020-03-05T17:37:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。