論文の概要: RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentangled Representation
- arxiv url: http://arxiv.org/abs/2509.05554v2
- Date: Mon, 29 Sep 2025 04:03:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 17:47:09.207249
- Title: RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentangled Representation
- Title(参考訳): RED: モダリティに特有なアンタングル表現を備えたロバストイベントガイドモーション
- Authors: Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao Jiang,
- Abstract要約: イベントカメラはスパースだが時間的に高解像度のモーション情報を提供する。
ダイナミックビジョンセンサー(DVS)の閾値を上げることでノイズを低減できるが、これは必然的にイベントの過度な報告を引き起こす。
本稿では,モダリティ特異的な不整合表現を備えたロバストイベント誘導型デブロワーリングネットワークを提案する。
- 参考スコア(独自算出の注目度): 25.898452981956364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event cameras provide sparse yet temporally high-resolution motion information, demonstrating great potential for motion deblurring. However, the delicate events are highly susceptible to noise. Although noise can be reduced by raising the threshold of Dynamic Vision Sensors (DVS), this inevitably causes under-reporting of events. Most existing event-guided deblurring methods overlook this practical trade-off, and the indiscriminate feature extraction and naive fusion result in unstable and mixed representations and ultimately unsatisfactory performance. To tackle these challenges, we propose a Robust Event-guided Deblurring (RED) network with modality-specific disentangled representation. First, we introduce a Robustness-Oriented Perturbation Strategy (RPS) that mimics various DVS thresholds, exposing RED to diverse under-reporting patterns and thereby fostering robustness under unknown conditions. With an adaption to RPS, a Modality-specific Representation Mechanism (MRM) is designed to explicitly model semantic understanding, motion priors, and cross-modality correlations from two inherently distinct but complementary sources: blurry images and partially disrupted events. Building on these reliable features, two interactive modules are presented to enhance motion-sensitive areas in blurry images and inject semantic context into under-reporting event representations. Extensive experiments on synthetic and real-world datasets demonstrate RED consistently achieves state-of-the-art performance in terms of both accuracy and robustness.
- Abstract(参考訳): イベントカメラはスパースだが時間的に高解像度のモーション情報を提供する。
しかし、微妙な出来事は騒音の影響を受けやすい。
ダイナミックビジョンセンサー(DVS)の閾値を上げることでノイズを低減できるが、これは必然的にイベントの過度な報告を引き起こす。
既存のイベント誘導型デブロワーリング手法の多くは、この実践的なトレードオフを見落としており、不差別な特徴抽出とナイーブ融合は不安定で混在した表現をもたらし、最終的には満足のいく性能を損なう。
これらの課題に対処するため、モーダリティ特異的な不整合表現を備えたロバストイベント誘導型デブロワーリング(RED)ネットワークを提案する。
まず、様々なDVS閾値を模倣したロバストネス指向摂動戦略(RPS)を導入する。
RPSに適応することにより、モダリティ固有の表現メカニズム(MRM)は、意味論的理解、動きの先行、および2つの本質的に異なる相補的なソース(ぼやけた画像と部分的に破壊された事象)からの相互モダリティ相関を明示的にモデル化するように設計されている。
これらの信頼性の高い特徴に基づいて、2つのインタラクティブなモジュールが提示され、ぼやけた画像における動きに敏感な領域を強化し、セマンティックコンテキストをアンダーレポーティングなイベント表現に注入する。
合成データセットと実世界のデータセットに関する大規模な実験は、REDが精度と堅牢性の両方の観点から、最先端のパフォーマンスを一貫して達成していることを示している。
関連論文リスト
- ClearSight: Human Vision-Inspired Solutions for Event-Based Motion Deblurring [5.827705323847176]
本研究はバイオインスパイアされたデュアルドライブハイブリッドネットワーク(BDHNet)を紹介する。
ヒト視覚系における視覚的注意機構にインスパイアされた本研究では、バイオインスパイアされたデュアルドライブハイブリッドネットワーク(BDHNet)を導入する。
論文 参考訳(メタデータ) (2025-01-27T06:28:45Z) - MATE: Motion-Augmented Temporal Consistency for Event-based Point Tracking [58.719310295870024]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。
事象の間隔に起因する曖昧さを解決するため、運動誘導モジュールは運動ベクトルを局所的なマッチングプロセスに組み込む。
このメソッドは、任意のポイントベースラインのイベントのみのトラッキングに対して、$Survival_50$メトリックを17.9%改善する。
論文 参考訳(メタデータ) (2024-12-02T09:13:29Z) - Motion-aware Latent Diffusion Models for Video Frame Interpolation [51.78737270917301]
隣接するフレーム間の動き推定は、動きのあいまいさを避ける上で重要な役割を担っている。
我々は、新しい拡散フレームワーク、動き認識潜在拡散モデル(MADiff)を提案する。
提案手法は,既存手法を著しく上回る最先端性能を実現する。
論文 参考訳(メタデータ) (2024-04-21T05:09:56Z) - Implicit Event-RGBD Neural SLAM [54.74363487009845]
神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文 参考訳(メタデータ) (2023-11-18T08:48:58Z) - Recovering Continuous Scene Dynamics from A Single Blurry Image with
Events [58.7185835546638]
インプリシットビデオ関数(IVF)は、同時イベントを伴う単一の動きのぼやけた画像を表現する。
両モードの利点を効果的に活用するために、二重注意変換器を提案する。
提案するネットワークは,限られた参照タイムスタンプの地平線画像の監督のみで訓練される。
論文 参考訳(メタデータ) (2023-04-05T18:44:17Z) - ProgressiveMotionSeg: Mutually Reinforced Framework for Event-Based
Motion Segmentation [101.19290845597918]
本稿では,動作推定 (ME) モジュールとイベントデノイング (ED) モジュールを相互に強化された方法で共同最適化する。
時間的相関をガイダンスとして、EDモジュールは各イベントが実活動イベントに属するという信頼度を算出し、MEモジュールに送信し、ノイズ抑制のための運動セグメンテーションのエネルギー関数を更新する。
論文 参考訳(メタデータ) (2022-03-22T13:40:26Z) - Motion Deblurring with Real Events [50.441934496692376]
本稿では,イベントベースの動作を自己教師型で記述するエンド・ツー・エンドの学習フレームワークを提案する。
実世界のイベントは、データ不整合によるパフォーマンス劣化を軽減するために利用される。
論文 参考訳(メタデータ) (2021-09-28T13:11:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。