論文の概要: v2e: From Video Frames to Realistic DVS Events
- arxiv url: http://arxiv.org/abs/2006.07722v2
- Date: Mon, 19 Apr 2021 08:30:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 21:18:40.280327
- Title: v2e: From Video Frames to Realistic DVS Events
- Title(参考訳): v2e: ビデオフレームからリアルなDVSイベントへ
- Authors: Yuhuang Hu and Shih-Chii Liu and Tobi Delbruck
- Abstract要約: 本稿では,高強度フレームからリアルな合成DVSイベントを生成するv2eツールボックスを提案する。
リアルなDVSイベントは、制御されていない照明条件のトレーニングネットワークで有用である。
- 参考スコア(独自算出の注目度): 16.562442770255032
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To help meet the increasing need for dynamic vision sensor (DVS) event camera
data, this paper proposes the v2e toolbox that generates realistic synthetic
DVS events from intensity frames. It also clarifies incorrect claims about DVS
motion blur and latency characteristics in recent literature. Unlike other
toolboxes, v2e includes pixel-level Gaussian event threshold mismatch, finite
intensity-dependent bandwidth, and intensity-dependent noise. Realistic DVS
events are useful in training networks for uncontrolled lighting conditions.
The use of v2e synthetic events is demonstrated in two experiments. The first
experiment is object recognition with N-Caltech 101 dataset. Results show that
pretraining on various v2e lighting conditions improves generalization when
transferred on real DVS data for a ResNet model. The second experiment shows
that for night driving, a car detector trained with v2e events shows an average
accuracy improvement of 40% compared to the YOLOv3 trained on intensity frames.
- Abstract(参考訳): ダイナミックビジョンセンサ(DVS)イベントカメラデータの必要性の高まりに対応するため,本研究では,高強度フレームからリアルな合成DVSイベントを生成するv2eツールボックスを提案する。
また、最近の文献でDVSの動作の曖昧さと遅延特性に関する誤った主張を明らかにしている。
他のツールボックスとは異なり、v2eはピクセルレベルのガウスイベントしきい値ミスマッチ、有限の強度依存帯域幅、強度依存ノイズを含む。
リアルなDVSイベントは、制御されていない照明条件のトレーニングネットワークで有用である。
v2e合成イベントの使用は2つの実験で実証された。
最初の実験は、N-Caltech 101データセットによるオブジェクト認識である。
その結果、様々なv2e照明条件での事前訓練は、resnetモデルで実際のdvsデータに転送する場合の一般化を改善できることがわかった。
第2の実験では、夜間運転では、v2eイベントで訓練された車両検知器が、強度フレームで訓練されたYOLOv3と比較して平均40%の精度向上を示した。
関連論文リスト
- LaSe-E2V: Towards Language-guided Semantic-Aware Event-to-Video Reconstruction [8.163356555241322]
セマンティック・アウェアの高品質なE2V再構成を実現する新しいフレームワークであるLaSe-E2Vを提案する。
まずイベント誘導時空間アテンション(ESA)モジュールを提案する。
次に、時間的コヒーレンスを確保するためのイベント対応マスクロスと、空間的一貫性を高めるためのノイズ戦略を導入する。
論文 参考訳(メタデータ) (2024-07-08T01:40:32Z) - Characterization of dim light response in DVS pixel: Discontinuity of event triggering time [7.623462728752422]
典型的なダイナミック・ビジョン・センサ(DVS)回路を解析し、イベントトリガー時間の不連続性があることを見出した。
この不連続性は光強度の変化速度にのみ依存していると指摘する。
論文 参考訳(メタデータ) (2024-04-27T03:55:53Z) - SEVD: Synthetic Event-based Vision Dataset for Ego and Fixed Traffic Perception [22.114089372056238]
我々は、SEVD、第一種マルチビューエゴ、固定認識合成イベントベースデータセットを提案する。
SEVDは、都市、郊外、田園部、ハイウェイのシーンに、様々な種類の物体がある。
本研究では,最新のイベントベース (RED, RVT) とフレームベース (YOLOv8) を用いて,トラフィック検出タスクのデータセットを評価する。
論文 参考訳(メタデータ) (2024-04-12T20:40:12Z) - Implicit Event-RGBD Neural SLAM [54.74363487009845]
神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文 参考訳(メタデータ) (2023-11-18T08:48:58Z) - EvDNeRF: Reconstructing Event Data with Dynamic Neural Radiance Fields [80.94515892378053]
EvDNeRFは、イベントデータを生成し、イベントベースの動的NeRFをトレーニングするためのパイプラインである。
NeRFは幾何学ベースの学習可能なレンダリングを提供するが、イベントの以前の作業は静的なシーンの再構築のみを考慮していた。
各種イベントのバッチサイズをトレーニングすることにより、微細な時間解像度でイベントのテスト時間予測を改善することができることを示す。
論文 参考訳(メタデータ) (2023-10-03T21:08:41Z) - V2CE: Video to Continuous Events Simulator [1.1009908861287052]
ダイナミック・ビジョン・センサ(DVS)の特性を考慮した複数視点からのストリーム変換のための新しい手法を提案する。
慎重に設計された一連のタイムスタンプ損失は、生成されたイベントボクセルの品質を大幅に向上させるのに役立つ。
また,イベント・ボクセルからのイベント・タイムスタンプを連続的に再現するための局所動的推論手法を提案する。
論文 参考訳(メタデータ) (2023-09-16T06:06:53Z) - Dual Memory Aggregation Network for Event-Based Object Detection with
Learnable Representation [79.02808071245634]
イベントベースのカメラはバイオインスパイアされたセンサーで、各ピクセルの明るさ変化を非同期に捉える。
イベントストリームは、正極性と負極性の両方のためにx-y-t座標の格子に分割され、3次元テンソル表現として柱の集合が生成される。
長メモリは適応型convLSTMの隠れ状態に符号化され、短メモリはイベントピラー間の空間的時間的相関を計算することによってモデル化される。
論文 参考訳(メタデータ) (2023-03-17T12:12:41Z) - EventNeRF: Neural Radiance Fields from a Single Colour Event Camera [81.19234142730326]
本稿では, 単色イベントストリームを入力として, 3次元一貫性, 密度, 新規なビュー合成法を提案する。
その中核は、カラーイベントチャンネルのオリジナルの解像度を維持しながら、イベントから完全に自己教師された方法で訓練された神経放射場である。
提案手法をいくつかの難解な合成シーンと実シーンで定性的・数値的に評価し,より密集し,より視覚的に魅力的であることを示す。
論文 参考訳(メタデータ) (2022-06-23T17:59:53Z) - VisEvent: Reliable Object Tracking via Collaboration of Frame and Event
Flows [93.54888104118822]
このタスクには現実的でスケールしたデータセットがないため、大規模なVisible-Eventベンチマーク(VisEventと呼ぶ)を提案する。
私たちのデータセットは、低照度、高速、背景乱雑なシナリオ下でキャプチャされた820のビデオペアで構成されています。
VisEventに基づいて、イベントフローをイベントイメージに変換し、30以上のベースラインメソッドを構築します。
論文 参考訳(メタデータ) (2021-08-11T03:55:12Z) - Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。
最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。
本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-16T12:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。