論文の概要: E-TIDE: Fast, Structure-Preserving Motion Forecasting from Event Sequences
- arxiv url: http://arxiv.org/abs/2603.27757v1
- Date: Sun, 29 Mar 2026 16:34:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.102557
- Title: E-TIDE: Fast, Structure-Preserving Motion Forecasting from Event Sequences
- Title(参考訳): E-TIDE:イベントシーケンスからの高速・構造保存動作予測
- Authors: Biswadeep Sen, Benoit R. Cottereau, Nicolas Cuperlier, Terence Sim,
- Abstract要約: イベントベースのカメラは、ピクセルごとの明るさ変化の非同期ストリームとして視覚情報をキャプチャし、スパースで時間的に正確なデータを生成する。
イベントテンソル予測のための軽量でエンドツーエンドのトレーニング可能なアーキテクチャであるE-TIDEを導入する。
- 参考スコア(独自算出の注目度): 2.6812215263618473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event-based cameras capture visual information as asynchronous streams of per-pixel brightness changes, generating sparse, temporally precise data. Compared to conventional frame-based sensors, they offer significant advantages in capturing high-speed dynamics while consuming substantially less power. Predicting future event representations from past observations is an important problem, enabling downstream tasks such as future semantic segmentation or object tracking without requiring access to future sensor measurements. While recent state-of-the-art approaches achieve strong performance, they often rely on computationally heavy backbones and, in some cases, large-scale pretraining, limiting their applicability in resource-constrained scenarios. In this work, we introduce E-TIDE, a lightweight, end-to-end trainable architecture for event-tensor prediction that is designed to operate efficiently without large-scale pretraining. Our approach employs the TIDE module (Temporal Interaction for Dynamic Events), motivated by efficient spatiotemporal interaction design for sparse event tensors, to capture temporal dependencies via large-kernel mixing and activity-aware gating while maintaining low computational complexity. Experiments on standard event-based datasets demonstrate that our method achieves competitive performance with significantly reduced model size and training requirements, making it well-suited for real-time deployment under tight latency and memory budgets.
- Abstract(参考訳): イベントベースのカメラは、ピクセルごとの明るさ変化の非同期ストリームとして視覚情報をキャプチャし、スパースで時間的に正確なデータを生成する。
従来のフレームベースのセンサーと比較すると、高速なダイナミクスを捉える上で大きな利点があるが、消費電力は大幅に少ない。
過去の観測から将来のイベント表現を予測することは重要な問題であり、将来のセンサ計測へのアクセスを必要とせずに、将来のセマンティックセグメンテーションやオブジェクトトラッキングといった下流タスクを可能にする。
最近の最先端のアプローチは高い性能を達成するが、しばしば計算的に重いバックボーンに依存し、時には大規模事前学習によってリソース制約のあるシナリオに適用性を制限する。
本研究では,イベントテンソル予測のための軽量でエンドツーエンドのトレーニング可能なアーキテクチャであるE-TIDEを紹介する。
提案手法はTIDEモジュール(Temporal Interaction for Dynamic Events)を用いて,分散イベントテンソルの効率的な時空間相互作用設計をモチベーションとし,計算複雑性を低く保ちながら,大規模カーネルミキシングとアクティビティ・アウェア・ゲーティングを通じて時間依存性を捕捉する。
標準のイベントベースデータセットを用いた実験により,本手法はモデルサイズとトレーニング要件を大幅に削減し,高いレイテンシとメモリ予算下でのリアルタイムデプロイメントに適していることを示す。
関連論文リスト
- Decoupling Spatio-Temporal Prediction: When Lightweight Large Models Meet Adaptive Hypergraphs [12.867023510751787]
STH-SepNetは、時間的および空間的表現性を効率と精度の両方に分離する新しいフレームワークである。
S-SepNetは、現実世界のアプリケーションにおける時間予測のための実用的でスケーラブルなソリューションを提供する。
この作業は、計算要求の削減と予測性能の向上を目的とした、時間的予測のための有望な軽量フレームワークを提供する可能性がある。
論文 参考訳(メタデータ) (2025-05-26T07:37:39Z) - SuperFlow++: Enhanced Spatiotemporal Consistency for Cross-Modal Data Pretraining [62.433137130087445]
SuperFlow++は、連続するカメラペアを使用して事前トレーニングと下流タスクを統合する新しいフレームワークである。
SuperFlow++は様々なタスクや運転条件で最先端のメソッドよりも優れています。
強力な一般化性と計算効率により、SuperFlow++は、自動運転におけるデータ効率の高いLiDARベースの認識のための新しいベンチマークを確立する。
論文 参考訳(メタデータ) (2025-03-25T17:59:57Z) - Scalable Event-by-event Processing of Neuromorphic Sensory Signals With Deep State-Space Models [2.551844666707809]
イベントベースのセンサーはリアルタイム処理に適している。
現在の方法では、イベントをフレームに分解するか、イベントデータをイベント単位で直接処理する場合にスケールアップできない。
論文 参考訳(メタデータ) (2024-04-29T08:50:27Z) - TimeGraphs: Graph-based Temporal Reasoning [64.18083371645956]
TimeGraphsは階層的時間グラフとして動的相互作用を特徴付ける新しいアプローチである。
提案手法は,コンパクトなグラフベース表現を用いて相互作用をモデル化し,多種多様な時間スケールでの適応推論を可能にする。
我々は,サッカーシミュレータ,抵抗ゲーム,MOMA人間活動データセットなど,複雑でダイナミックなエージェントインタラクションを持つ複数のデータセット上でTimeGraphsを評価する。
論文 参考訳(メタデータ) (2024-01-06T06:26:49Z) - Spatio-Temporal Graph Neural Point Process for Traffic Congestion Event
Prediction [16.530361912832763]
本稿では,交通渋滞イベント予測のための時間グラフニューラルポイントプロセスフレームワークSTNPPを提案する。
提案手法は,既存の最先端手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-11-15T01:22:47Z) - SpikeMOT: Event-based Multi-Object Tracking with Sparse Motion Features [52.213656737672935]
SpikeMOTはイベントベースのマルチオブジェクトトラッカーである。
SpikeMOTはスパイクニューラルネットワークを使用して、オブジェクトに関連するイベントストリームからスパーステンポラルな特徴を抽出する。
論文 参考訳(メタデータ) (2023-09-29T05:13:43Z) - Asynchronous Optimisation for Event-based Visual Odometry [53.59879499700895]
イベントカメラは、低レイテンシと高ダイナミックレンジのために、ロボット知覚の新しい可能性を開く。
イベントベースビジュアル・オドメトリー(VO)に焦点をあてる
動作最適化のバックエンドとして非同期構造を提案する。
論文 参考訳(メタデータ) (2022-03-02T11:28:47Z) - Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。
最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。
本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-16T12:36:23Z) - Event-based Asynchronous Sparse Convolutional Networks [54.094244806123235]
イベントカメラはバイオインスパイアされたセンサーで、非同期でスパースな「イベント」の形で画素ごとの明るさ変化に反応する。
同期画像のようなイベント表現で訓練されたモデルを、同じ出力を持つ非同期モデルに変換するための一般的なフレームワークを提案する。
理論的および実験的に、これは高容量同期ニューラルネットワークの計算複雑性と遅延を大幅に減少させることを示す。
論文 参考訳(メタデータ) (2020-03-20T08:39:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。