論文の概要: EEvAct: Early Event-Based Action Recognition with High-Rate Two-Stream Spiking Neural Networks
- arxiv url: http://arxiv.org/abs/2507.07734v1
- Date: Thu, 10 Jul 2025 13:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.409912
- Title: EEvAct: Early Event-Based Action Recognition with High-Rate Two-Stream Spiking Neural Networks
- Title(参考訳): EEvAct: 高速2ストリームスパイクニューラルネットワークによるイベントベース行動認識
- Authors: Michael Neumeier, Jules Lecomte, Nils Kazinski, Soubarna Banik, Bing Li, Axel von Arnim,
- Abstract要約: イベントベースの視覚センサーは、早期認識の需要にぴったり合う。
既存の処理アプローチのほとんどは、低レートフレームや時空ボクセルにイベントを蓄積する。
本稿では,このギャップを埋める高速な2ストリームSNNを提案する。
- 参考スコア(独自算出の注目度): 3.104843835915411
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recognizing human activities early is crucial for the safety and responsiveness of human-robot and human-machine interfaces. Due to their high temporal resolution and low latency, event-based vision sensors are a perfect match for this early recognition demand. However, most existing processing approaches accumulate events to low-rate frames or space-time voxels which limits the early prediction capabilities. In contrast, spiking neural networks (SNNs) can process the events at a high-rate for early predictions, but most works still fall short on final accuracy. In this work, we introduce a high-rate two-stream SNN which closes this gap by outperforming previous work by 2% in final accuracy on the large-scale THU EACT-50 dataset. We benchmark the SNNs within a novel early event-based recognition framework by reporting Top-1 and Top-5 recognition scores for growing observation time. Finally, we exemplify the impact of these methods on a real-world task of early action triggering for human motion capture in sports.
- Abstract(参考訳): 人間-ロボット・ヒューマン・マシン・インタフェースの安全性と応答性には、早期に人間の活動を認識することが不可欠である。
時間分解能が高く、レイテンシも低いため、イベントベースの視覚センサは、この早期認識要求に最適である。
しかし、既存の処理アプローチのほとんどは、早期予測能力を制限する低レートフレームや時空ボクセルにイベントを蓄積する。
対照的に、スパイクニューラルネットワーク(SNN)は早期予測のために高いレートでイベントを処理できるが、ほとんどの作業は最終的な精度で不足している。
本研究では,大規模なTHU THU EACT-50データセットの最終的な精度を2%向上させることで,このギャップを埋める高速な2ストリームSNNを提案する。
我々は、観測時間の増加のために、Top-1とTop-5の認識スコアを報告することにより、新しいイベントベースの認識フレームワーク内でSNNをベンチマークする。
最後に,これらの手法がスポーツにおける人間のモーションキャプチャーのための早期アクショントリガーの実際のタスクに与える影響を実証する。
関連論文リスト
- Continuous-Time Human Motion Field from Events [26.355172872510238]
本稿では,イベントの流れから連続的な人体運動場を推定する上での課題について述べる。
我々は、繰り返しフィードフォワードニューラルネットワークを用いて、人間の動きの潜在空間における人間の動きを予測する。
本稿では,従来の離散時間予測を時系列関数として表現した連続的な人体運動場に置き換える最初の研究について述べる。
論文 参考訳(メタデータ) (2024-12-02T17:42:59Z) - Meta-Learning for Neural Network-based Temporal Point Processes [36.31950058651308]
ポイントプロセスは、人間の活動に関連する事象を予測するために広く使われている。
最近の高性能ポイントプロセスモデルでは、長期間にわたって収集された十分な数のイベントを入力する必要がある。
短周期の事象の周期性を考慮した予測のためのメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2024-01-29T02:42:22Z) - Automotive Object Detection via Learning Sparse Events by Spiking Neurons [20.930277906912394]
スパイキングニューラルネットワーク(SNN)は、本質的にイベントベースのデータと整合した時間的表現を提供する。
自動車のイベントベース物体検出に最適化された特化スパイキング特徴ピラミッドネットワーク(SpikeFPN)を提案する。
論文 参考訳(メタデータ) (2023-07-24T15:47:21Z) - DisenHCN: Disentangled Hypergraph Convolutional Networks for
Spatiotemporal Activity Prediction [53.76601630407521]
本稿では,既存のソリューションのギャップを埋めるために,DistenHCNと呼ばれるハイパーグラフネットワークモデルを提案する。
特に,ユーザの好みと時間的活動の複雑なマッチングをヘテロジニアスなハイパーグラフにまとめる。
次に、ユーザ表現を異なる側面(位置認識、時間認識、活動認識)に切り離し、構築したハイパーグラフ上に対応するアスペクトの特徴を集約する。
論文 参考訳(メタデータ) (2022-08-14T06:51:54Z) - AEGNN: Asynchronous Event-based Graph Neural Networks [54.528926463775946]
イベントベースのグラフニューラルネットワークは、標準のGNNを一般化して、イベントを"進化的"時間グラフとして処理する。
AEGNNは同期入力で容易に訓練でき、テスト時に効率的な「非同期」ネットワークに変換できる。
論文 参考訳(メタデータ) (2022-03-31T16:21:12Z) - Multi-head Temporal Attention-Augmented Bilinear Network for Financial
time series prediction [77.57991021445959]
本稿では,時間的注意と多面的注意の考え方に基づいて,ニューラルネットワークの能力を拡張するニューラルネットワーク層を提案する。
本手法の有効性を,大規模書籍市場データを用いて検証した。
論文 参考訳(メタデータ) (2022-01-14T14:02:19Z) - Investigating Pose Representations and Motion Contexts Modeling for 3D
Motion Prediction [63.62263239934777]
歴史的ポーズシーケンスから人間の動きを予測することは、機械が人間と知的な相互作用を成功させるために不可欠である。
本研究では,様々なポーズ表現に関する詳細な研究を行い,その動作予測課題に対する効果に着目した。
AHMR(Attentive Hierarchical Motion Recurrent Network)と呼ばれる新しいRNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-30T10:45:22Z) - Hybrid SNN-ANN: Energy-Efficient Classification and Object Detection for
Event-Based Vision [64.71260357476602]
イベントベースの視覚センサは、画像フレームではなく、イベントストリームの局所的な画素単位の明るさ変化を符号化する。
イベントベースセンサーによる物体認識の最近の進歩は、ディープニューラルネットワークの変換によるものである。
本稿では、イベントベースのパターン認識とオブジェクト検出のためのディープニューラルネットワークのエンドツーエンドトレーニングのためのハイブリッドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-06T23:45:58Z) - Development of Human Motion Prediction Strategy using Inception Residual
Block [1.0705399532413613]
Inception Residual Block (IRB) を提案する。
我々の主な貢献は、事前に観測されたポーズと次の予測されたポーズの間に連続性を持つように、入力と開始ブロックの出力の間の残差接続を提案することである。
提案したアーキテクチャでは、人間のポーズに関する事前知識をよりよく学習し、論文で詳述したよりはるかに高い予測精度を達成する。
論文 参考訳(メタデータ) (2021-08-09T12:49:48Z) - Temporal-wise Attention Spiking Neural Networks for Event Streams
Classification [6.623034896340885]
スパイキングニューラルネットワーク(英: Spiking Neural Network、SNN)は、脳にトリガーされたイベントトリガーコンピューティングモデルである。
本研究では,イベントストリーム処理のためのフレームベース表現学習のための時間的注意SNNモデルを提案する。
TA-SNNモデルはイベントストリーム分類タスクの精度を向上させることを実証する。
論文 参考訳(メタデータ) (2021-07-25T02:28:44Z) - Adversarial Refinement Network for Human Motion Prediction [61.50462663314644]
リカレントニューラルネットワークとフィードフォワードディープネットワークという2つの一般的な手法は、粗い動きの傾向を予測することができる。
本稿では,新たな逆誤差増大を伴う簡易かつ効果的な粗大きめ機構に従えば,ARNet(Adversarial Refinement Network)を提案する。
論文 参考訳(メタデータ) (2020-11-23T05:42:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。