論文の概要: Fast Window-Based Event Denoising with Spatiotemporal Correlation
Enhancement
- arxiv url: http://arxiv.org/abs/2402.09270v1
- Date: Wed, 14 Feb 2024 15:56:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 14:58:24.175878
- Title: Fast Window-Based Event Denoising with Spatiotemporal Correlation
Enhancement
- Title(参考訳): 時空間相関強化を用いた高速ウィンドウベースイベントデノナイズ
- Authors: Huachen Fang, Jinjian Wu, Qibin Hou, Weisheng Dong and Guangming Shi
- Abstract要約: 同時にイベントのスタックを扱うウィンドウベースのイベントデノゲーションを提案する。
空間領域では、実世界の事象と雑音を識別するために、最大後部(MAP)を選択する。
我々のアルゴリズムは、イベントノイズを効果的かつ効率的に除去し、下流タスクの性能を向上させることができる。
- 参考スコア(独自算出の注目度): 85.66867277156089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous deep learning-based event denoising methods mostly suffer from poor
interpretability and difficulty in real-time processing due to their complex
architecture designs. In this paper, we propose window-based event denoising,
which simultaneously deals with a stack of events while existing element-based
denoising focuses on one event each time. Besides, we give the theoretical
analysis based on probability distributions in both temporal and spatial
domains to improve interpretability. In temporal domain, we use timestamp
deviations between processing events and central event to judge the temporal
correlation and filter out temporal-irrelevant events. In spatial domain, we
choose maximum a posteriori (MAP) to discriminate real-world event and noise,
and use the learned convolutional sparse coding to optimize the objective
function. Based on the theoretical analysis, we build Temporal Window (TW)
module and Soft Spatial Feature Embedding (SSFE) module to process temporal and
spatial information separately, and construct a novel multi-scale window-based
event denoising network, named MSDNet. The high denoising accuracy and fast
running speed of our MSDNet enables us to achieve real-time denoising in
complex scenes. Extensive experimental results verify the effectiveness and
robustness of our MSDNet. Our algorithm can remove event noise effectively and
efficiently and improve the performance of downstream tasks.
- Abstract(参考訳): 従来のディープラーニングベースのイベントデノイジング手法は、複雑なアーキテクチャ設計のため、解釈可能性の低さとリアルタイム処理の難しさに苦しめられている。
本稿では,イベントのスタックを同時に扱うウィンドウベースのイベントデノイジングを提案し,既存の要素ベースのデノイジングではイベント毎にひとつのイベントに焦点を当てる。
さらに,時間領域と空間領域の確率分布に基づく理論的解析を行い,解釈可能性の向上を図る。
時間領域では、処理イベントと中央イベントのタイムスタンプ偏差を用いて時間相関を判断し、時間非関連イベントをフィルタリングする。
空間領域では、実世界の事象とノイズを識別するために最大後方(map)を選択し、学習された畳み込みスパース符号を用いて目的関数を最適化する。
この理論解析に基づいて時間窓(tw)モジュールとソフト空間特徴埋め込み(ssfe)モジュールを構築し、時間空間情報と空間情報を別々に処理し、msdnetと呼ばれる新しいマルチスケールウィンドウベースのイベントデノージングネットワークを構築する。
MSDNetの高ノイズ化精度と高速実行速度により、複雑なシーンでのリアルタイムデノイズ化を実現できます。
広範な実験結果から,msdnetの有効性とロバスト性を確認した。
提案手法は,イベントノイズを効果的かつ効率的に除去し,ダウンストリームタスクの性能を向上させる。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Revisit Event Generation Model: Self-Supervised Learning of Event-to-Video Reconstruction with Implicit Neural Representations [11.874972134063638]
本稿では,ラベル付きデータや光フロー推定を必要としない新しいSSLイベント・ビデオ再構成手法であるEvINRを提案する。
我々は、(x, y, t)$を座標とする暗黙的ニューラル表現(INR)を用いて、事象発生方程式を表現する。
オンラインの要求に対してEvINRを実現するために,トレーニングプロセスを大幅に高速化するいくつかのアクセラレーション手法を提案する。
論文 参考訳(メタデータ) (2024-07-26T04:18:10Z) - Rethinking Efficient and Effective Point-based Networks for Event Camera Classification and Regression: EventMamba [11.400397931501338]
イベントカメラは、最小限の電力を消費しながら、低レイテンシで高ダイナミックレンジで環境光の変化を効率的に検出する。
イベントデータを処理する現在のアプローチでは、フレームベースの表現に変換することが多い。
Point Cloudは3D処理の一般的な表現であり、イベントカメラのスパースと非同期性に適合するのに適している。
提案するEventMambaは,最先端(SOTA)のフレームベース手法と比較しても,競合的な結果が得られる,効率的かつ効果的なPoint Cloudフレームワークである。
論文 参考訳(メタデータ) (2024-05-09T21:47:46Z) - Scalable Event-by-event Processing of Neuromorphic Sensory Signals With Deep State-Space Models [2.551844666707809]
イベントベースのセンサーはリアルタイム処理に適している。
現在の方法では、イベントをフレームに分解するか、イベントデータをイベント単位で直接処理する場合にスケールアップできない。
論文 参考訳(メタデータ) (2024-04-29T08:50:27Z) - Representation Learning on Event Stream via an Elastic Net-incorporated
Tensor Network [1.9515859963221267]
本稿では,イベントストリーム中のすべてのイベントのグローバルな相関を同時に取得できる新しい表現法を提案する。
本手法は, 最先端手法と比較して, フィルタノイズなどの応用において有効な結果が得られる。
論文 参考訳(メタデータ) (2024-01-16T02:51:47Z) - Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - Implicit Event-RGBD Neural SLAM [54.74363487009845]
神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文 参考訳(メタデータ) (2023-11-18T08:48:58Z) - DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - Ev-TTA: Test-Time Adaptation for Event-Based Object Recognition [7.814941658661939]
Ev-TTAは、イベントベースのオブジェクト認識のためのシンプルで効果的なテスト時間適応である。
我々の定式化は、入力表現に関係なくうまく適用でき、回帰タスクに拡張できる。
論文 参考訳(メタデータ) (2022-03-23T07:43:44Z) - ProgressiveMotionSeg: Mutually Reinforced Framework for Event-Based
Motion Segmentation [101.19290845597918]
本稿では,動作推定 (ME) モジュールとイベントデノイング (ED) モジュールを相互に強化された方法で共同最適化する。
時間的相関をガイダンスとして、EDモジュールは各イベントが実活動イベントに属するという信頼度を算出し、MEモジュールに送信し、ノイズ抑制のための運動セグメンテーションのエネルギー関数を更新する。
論文 参考訳(メタデータ) (2022-03-22T13:40:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。