論文の概要: Neural Events: Discrete Asynchronous Autoencoders for Event-Based Vision
- arxiv url: http://arxiv.org/abs/2606.19835v1
- Date: Thu, 18 Jun 2026 06:26:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.682986
- Title: Neural Events: Discrete Asynchronous Autoencoders for Event-Based Vision
- Title(参考訳): Neural Events: イベントベースのビジョンのための離散非同期オートエンコーダ
- Authors: Roberto Pellerito, Daniel Gehrig, Shintaro Shiba, Davide Scaramuzza,
- Abstract要約: イベントカメラは、例外的な時間的忠実さでダイナミックなシーンをキャプチャする。
意味のある信号を導き出すには、下流のアルゴリズムは、低情報事象の巨大なトレントから素早く統合する必要がある。
本稿では,イベントストリームを高情報なテクストニューラルイベントの小さなセットに再構成するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 33.23552175352345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Event cameras capture dynamic scenes with exceptional temporal fidelity by representing them as a continuous stream of microsecond resolution \textit{events}. Each individual event, however, only carries minimal semantic value, merely signaling a localized brightness change. To derive meaningful signals, downstream algorithms need to quickly integrate cues from a potentially massive torrent of low-information events. Current architectures, however, are easily overwhelmed, struggling to balance capturing fine-grained temporal dynamics and maintaining a manageable data throughput. This paper proposes a framework to re-tokenize event streams into a small set of highly informative \textit{neural events}, each representing a local spatio-temporal context window with a discrete learnable code. Every time this code flips, a neural event is triggered, yielding a highly compressed data stream. We demonstrate that, across object detection and classification, networks trained on neural events are on par or surpass the performance of state-of-the-art approaches while reducing the event rate by a factor of 2.0.
- Abstract(参考訳): イベントカメラは、それをマイクロ秒解像度 \textit{events} の連続ストリームとして表現することで、例外的な時間的忠実さを持つ動的なシーンをキャプチャする。
しかし、個々のイベントは最小限の意味値しか持たず、単に局所的な明るさ変化を示すだけである。
意味のある信号を導き出すには、下流のアルゴリズムは、低情報イベントの潜在的に巨大なトレントからのキューを迅速に統合する必要がある。
しかし、現在のアーキテクチャは簡単に圧倒され、きめ細かい時間的ダイナミクスの取得と、管理可能なデータスループットの維持のバランスをとるのに苦労しています。
本稿では,イベントストリームを,個別の学習可能なコードで局所的な時空間ウィンドウを表す,高度に情報に富んだ“textit{neural events}”の小さなセットに再構築するフレームワークを提案する。
このコードが反転するたびに、神経イベントがトリガーされ、高度に圧縮されたデータストリームが生成される。
オブジェクトの検出と分類において、ニューラルイベントに基づいてトレーニングされたネットワークは、最先端のアプローチのパフォーマンスを同等または超過し、イベントレートを2.0に削減することを示した。
関連論文リスト
- EventGait: Towards Robust Gait Recognition with Event Streams [50.890621860023]
イベントカメラは、マイクロ秒時間分解能と高ダイナミックレンジを提供し、自然にロバストなダイナミックキューをキャプチャし、静的ノイズを抑制する。
イベントの利点を保ちながら、動きと形状を別々にモデル化する、エンドツーエンドのデュアルストリームフレームワークである textbfEventGait を提案する。
当社のアプローチでは,イベント駆動歩行分析の堅牢性と可能性を強調し,合成および実世界の歩行ベンチマークに新たな技術状況が設定されている。
論文 参考訳(メタデータ) (2026-05-21T08:12:04Z) - EventSTU: Event-Guided Efficient Spatio-Temporal Understanding for Video Large Language Models [56.16721798968254]
本研究では,EventSTUという,効率的な理解のためのイベント誘導学習自由フレームワークを提案する。
時間領域において、不要な大フレームを除去するために、イベントカメラのトリガー特性を変化させる粗大なサンプリングアルゴリズムを設計する。
空間領域では,イベントの正当性をゼロコストとして活用し,空間的縮小を誘導する適応的トークンプルーニングアルゴリズムを実現する。
論文 参考訳(メタデータ) (2025-11-24T09:30:02Z) - Self-Supervised Event Representations: Towards Accurate, Real-Time Perception on SoC FPGAs [0.0]
イベントカメラは、従来のフレームベースのセンサーよりも大きな利点がある。
疎結合で非同期なイベントストリームを効果的に処理することは依然として難しい。
本稿では,新しい自己監視イベント表現(SSER)手法を提案する。
論文 参考訳(メタデータ) (2025-05-12T13:32:08Z) - Representation Learning on Event Stream via an Elastic Net-incorporated
Tensor Network [1.9515859963221267]
本稿では,イベントストリーム中のすべてのイベントのグローバルな相関を同時に取得できる新しい表現法を提案する。
本手法は, 最先端手法と比較して, フィルタノイズなどの応用において有効な結果が得られる。
論文 参考訳(メタデータ) (2024-01-16T02:51:47Z) - EvDNeRF: Reconstructing Event Data with Dynamic Neural Radiance Fields [80.94515892378053]
EvDNeRFは、イベントデータを生成し、イベントベースの動的NeRFをトレーニングするためのパイプラインである。
NeRFは幾何学ベースの学習可能なレンダリングを提供するが、イベントの以前の作業は静的なシーンの再構築のみを考慮していた。
各種イベントのバッチサイズをトレーニングすることにより、微細な時間解像度でイベントのテスト時間予測を改善することができることを示す。
論文 参考訳(メタデータ) (2023-10-03T21:08:41Z) - Graph-based Asynchronous Event Processing for Rapid Object Recognition [59.112755601918074]
イベントカメラは、各イベントがピクセル位置、トリガ時間、明るさの極性が変化するような非同期イベントストリームをキャプチャする。
イベントカメラのための新しいグラフベースのフレームワーク、SlideGCNを紹介した。
当社のアプローチでは、データをイベント単位で効率的に処理し、内部でグラフの構造を維持しながら、イベントデータの低レイテンシ特性を解放することが可能です。
論文 参考訳(メタデータ) (2023-08-28T08:59:57Z) - Hierarchical Neural Memory Network for Low Latency Event Processing [35.34966621111271]
本稿では,イベントベース高密度予測タスクのための低レイテンシニューラルネットワークアーキテクチャを提案する。
我々は、異なるレートで動作するスタック化された潜在記憶を用いて、時間的階層を構築することで、これを実現する。
提案手法は既存の手法よりも精度とレイテンシが優れている3つの事象ベース密集予測タスクについて広範囲に評価する。
論文 参考訳(メタデータ) (2023-05-29T02:29:16Z) - Dual Memory Aggregation Network for Event-Based Object Detection with
Learnable Representation [79.02808071245634]
イベントベースのカメラはバイオインスパイアされたセンサーで、各ピクセルの明るさ変化を非同期に捉える。
イベントストリームは、正極性と負極性の両方のためにx-y-t座標の格子に分割され、3次元テンソル表現として柱の集合が生成される。
長メモリは適応型convLSTMの隠れ状態に符号化され、短メモリはイベントピラー間の空間的時間的相関を計算することによってモデル化される。
論文 参考訳(メタデータ) (2023-03-17T12:12:41Z) - Event Transformer [43.193463048148374]
イベントカメラの消費電力が低く、マイクロ秒の明るさを捉える能力は、様々なコンピュータビジョンタスクにとって魅力的である。
既存のイベント表現方法は通常、イベントをフレーム、ボクセルグリッド、ディープニューラルネットワーク(DNN)のスパイクに変換する。
この研究はトークンベースの新しいイベント表現を導入し、各イベントはイベントトークンと呼ばれる基本的な処理ユニットと見なされる。
論文 参考訳(メタデータ) (2022-04-11T15:05:06Z) - Event-based Asynchronous Sparse Convolutional Networks [54.094244806123235]
イベントカメラはバイオインスパイアされたセンサーで、非同期でスパースな「イベント」の形で画素ごとの明るさ変化に反応する。
同期画像のようなイベント表現で訓練されたモデルを、同じ出力を持つ非同期モデルに変換するための一般的なフレームワークを提案する。
理論的および実験的に、これは高容量同期ニューラルネットワークの計算複雑性と遅延を大幅に減少させることを示す。
論文 参考訳(メタデータ) (2020-03-20T08:39:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。