論文の概要: AdaFuse-Det: Adaptive Cross-Modal Fusion of Event Cameras for Robust Object Detection in Low-Light RGB Imagery
- arxiv url: http://arxiv.org/abs/2605.24691v1
- Date: Sat, 23 May 2026 18:01:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.330154
- Title: AdaFuse-Det: Adaptive Cross-Modal Fusion of Event Cameras for Robust Object Detection in Low-Light RGB Imagery
- Title(参考訳): AdaFuse-Det:ローライトRGB画像におけるロバスト物体検出のためのイベントカメラの適応的クロスモーダル融合
- Authors: Raju Imandi, Chethana B, Bharatesh Chakravarthi, Yong-Guk Kim, Manipriya S, Pavan Kumar B N,
- Abstract要約: 本稿では、CLAHE強化RGBフレームとボキセル化イベントテンソルを融合したデュアルストリームフレームワークであるAdaFuse-Detを紹介する。
LLE-VOSベンチマークでは、AdaFuse-Detのリコールは65.54%、精度は53.85%、F1-Scoreは59.12%である。
- 参考スコア(独自算出の注目度): 2.804640719143954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting objects reliably under extreme low-light conditions is an open problem in computer vision, with practical urgency in applications ranging from nighttime surveillance to search-and-rescue robotics. Conventional RGB cameras degrade sharply at low photon flux, while event cameras which record asynchronous per-pixel brightness changes at microsecond resolution and high dynamic range provide complementary structural cues that are largely illumination-invariant. We present AdaFuse-Det, a dual-stream framework that fuses CLAHE-enhanced RGB frames with voxelized event tensors through an Adaptive Cross-Modal Fusion (ACMF) module grounded in minimum-variance linear estimation theory. We formally show that the learned attention map asymptotically recovers the Gauss-Markov optimal fusion weights, and establish event conservation and temporal resolution bounds for the voxelization stage. On the LLE-VOS benchmark, AdaFuse-Det achieves a Recall of $65.54\%$, Precision of $53.85\%$, and F1-Score of $59.12\%$ under severe illumination degradation, outperforming single-modality detectors in recall by a margin that reflects the theoretically predicted illumination-adaptation behavior.
- Abstract(参考訳): 極端に低照度な条件下で物体を確実に検出することは、コンピュータビジョンにおいてオープンな問題であり、夜間監視から捜索救助ロボティクスまで、応用の現実的な緊急性がある。
従来のRGBカメラは低光子フラックスで急激に劣化する一方、マイクロ秒解像度と高ダイナミックレンジで非同期の画素当たりの明るさ変化を記録するイベントカメラは、主に照明不変な補完的な構造的手がかりを提供する。
AdaFuse-Detは、最小分散線形推定理論に基づく適応的クロスモーダルフュージョン(ACMF)モジュールを通して、CLAHEで強化されたRGBフレームとボキセル化イベントテンソルを融合するデュアルストリームフレームワークである。
学習した注意マップがガウス・マルコフの最適核融合重みを漸近的に回復し、酸素化段階の事象保存と時間分解境界を確立することを正式に示す。
LLE-VOSベンチマークでは、AdaFuse-Detは65.54\%、精度53.85\%、F1-Score59.12\%のリコールを達成した。
関連論文リスト
- Event-based Batting Impact Estimation [1.6111818380407035]
検出したボールとコウモリの間の重み付き遠心点距離に基づいて衝突タイミングを推定する新しい枠組みを提案する。
実世界のデータセットを用いた実験により,本手法は困難条件下での精度が向上することを示した。
論文 参考訳(メタデータ) (2026-05-25T10:04:14Z) - Beyond conventional vision: RGB-event fusion for robust object detection in dynamic traffic scenarios [23.41380544271609]
従来のRGBカメラのダイナミックレンジは、大域的なコントラストを減少させ、高周波の詳細が失われる。
そこで本研究では,光の難易度を最適化した移動キュー融合ネットワーク(MCFNet)を提案する。
MCFNetは、様々な低照度および高速移動トラフィックシナリオにおいて、既存の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2025-08-14T14:48:21Z) - Bidirectional Image-Event Guided Fusion Framework for Low-Light Image Enhancement [24.5584423318892]
極端に低照度な条件下では、フレームベースのカメラは、ダイナミックレンジの制限により、細部が著しく失われる。
近年の研究では、イベント誘導型低照度画像強調のためのイベントカメラが導入されている。
低光画像強調のための双方向画像イベント誘導融合フレームワークBiLIEを提案する。
論文 参考訳(メタデータ) (2025-06-06T14:28:17Z) - Low-Light Image Enhancement using Event-Based Illumination Estimation [83.81648559951684]
低照度画像強調(LLIE)は、低照度環境で撮影された画像の可視性を改善することを目的としている。
本稿では,「時間的マッピング」イベントを用いた照明推定の観点から,新たな道を開く。
我々は、ビームスプリッターのセットアップを構築し、画像、時間的マッピングイベント、モーションイベントを含むEvLowLightデータセットを収集する。
論文 参考訳(メタデータ) (2025-04-13T00:01:33Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Implicit Event-RGBD Neural SLAM [54.74363487009845]
神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文 参考訳(メタデータ) (2023-11-18T08:48:58Z) - Chasing Day and Night: Towards Robust and Efficient All-Day Object Detection Guided by an Event Camera [8.673063170884591]
EOLOは、RGBとイベントモダリティの両方を融合させることで、堅牢で効率的な全日検出を実現する、新しいオブジェクト検出フレームワークである。
我々のEOLOフレームワークは、イベントの非同期特性を効率的に活用するために、軽量スパイキングニューラルネットワーク(SNN)に基づいて構築されている。
論文 参考訳(メタデータ) (2023-09-17T15:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。