論文の概要: E-RGB-D: Real-Time Event-Based Perception with Structured Light
- arxiv url: http://arxiv.org/abs/2512.18429v1
- Date: Sat, 20 Dec 2025 17:08:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.32874
- Title: E-RGB-D: Real-Time Event-Based Perception with Structured Light
- Title(参考訳): E-RGB-D:構造化光によるリアルタイムイベントベース知覚
- Authors: Seyed Ehsan Marjani Bajestani, Giovanni Beltrame,
- Abstract要約: イベントベースのカメラ(EC)は、バイオインスパイアされたセンサーとして登場し、ピクセルの明るさが非同期に変化することを報告している。
本稿では、デジタル光処理(DLP)プロジェクタを統合し、RGB-Dセンシングのためのアクティブ構造光(ASL)を形成する新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 4.894362825271711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Event-based cameras (ECs) have emerged as bio-inspired sensors that report pixel brightness changes asynchronously, offering unmatched speed and efficiency in vision sensing. Despite their high dynamic range, temporal resolution, low power consumption, and computational simplicity, traditional monochrome ECs face limitations in detecting static or slowly moving objects and lack color information essential for certain applications. To address these challenges, we present a novel approach that integrates a Digital Light Processing (DLP) projector, forming Active Structured Light (ASL) for RGB-D sensing. By combining the benefits of ECs and projection-based techniques, our method enables the detection of color and the depth of each pixel separately. Dynamic projection adjustments optimize bandwidth, ensuring selective color data acquisition and yielding colorful point clouds without sacrificing spatial resolution. This integration, facilitated by a commercial TI LightCrafter 4500 projector and a monocular monochrome EC, not only enables frameless RGB-D sensing applications but also achieves remarkable performance milestones. With our approach, we achieved a color detection speed equivalent to 1400 fps and 4 kHz of pixel depth detection, significantly advancing the realm of computer vision across diverse fields from robotics to 3D reconstruction methods. Our code is publicly available: https://github.com/MISTLab/event_based_rgbd_ros
- Abstract(参考訳): イベントベースのカメラ(EC)は、バイオインスパイアされたセンサーとして登場し、ピクセルの明るさが非同期に変化し、視覚センサーの速度と効率が一致しない。
高ダイナミックレンジ、時間分解能、低消費電力、計算の単純さにもかかわらず、従来のモノクロECは静的またはゆっくり動く物体を検出し、特定のアプリケーションに必要な色情報を欠いている。
これらの課題に対処するために、デジタル光処理(DLP)プロジェクタを統合し、RGB-Dセンシングのためのアクティブ構造光(ASL)を形成する新しいアプローチを提案する。
本手法は,ECの利点と投影に基づく手法を組み合わせることで,各画素の色と深さを別々に検出することができる。
ダイナミックプロジェクション調整は、帯域幅を最適化し、選択的なカラーデータ取得を確保し、空間解像度を犠牲にすることなくカラフルな点雲を得る。
この統合は商用のTI LightCrafter 4500プロジェクターとモノクロームECによって促進され、フレームレスのRGB-Dセンシングアプリケーションだけでなく、優れたパフォーマンスのマイルストーンも達成している。
提案手法では,1400fps,4kHzの画素深度検出が可能な色検出速度を実現し,ロボット工学から3次元再構成まで多種多様な分野におけるコンピュータビジョンの領域を著しく向上させた。
https://github.com/MISTLab/event_based_rgbd_ros
関連論文リスト
- IrisNet: Infrared Image Status Awareness Meta Decoder for Infrared Small Targets Detection [92.56025546608699]
IrisNetは、入力赤外線画像ステータスに検出戦略を適用する、新しいメタ学習フレームワークである。
提案手法は,赤外線画像特徴量とデコーダパラメータ全体の動的マッピングを確立する。
NUDT-SIRST、NUAA-SIRST、IRSTD-1Kデータセットの実験は、我々のIrisNetの優位性を示している。
論文 参考訳(メタデータ) (2025-11-25T13:53:54Z) - SPACT18: Spiking Human Action Recognition Benchmark Dataset with Complementary RGB and Thermal Modalities [14.157338282165037]
スパイクカメラ、バイオインスパイアされた視覚センサー、各ピクセルに光強度を蓄積して非同期に発火し、例外的な解像度のスパイクを提供する。
この研究は、エネルギー効率、超低消費電力のビデオ理解、特にスパイクベースのデータを用いた行動認識の研究を促進するデータセットに貢献する。
論文 参考訳(メタデータ) (2025-07-22T01:59:14Z) - SAGA: Semantic-Aware Gray color Augmentation for Visible-to-Thermal Domain Adaptation across Multi-View Drone and Ground-Based Vision Systems [1.891522135443594]
ドメイン適応型熱オブジェクト検出は、可視(RGB)から熱(IR)への適応を促進する上で重要な役割を果たす。
色やテクスチャの手がかりの欠如など、赤外線画像の固有の制限は、RGB訓練されたモデルに課題をもたらす。
本稿では,カラーバイアスを緩和し,領域ギャップを埋めるための新しい戦略であるセマンティック・アウェア・グレイカラー拡張(SAGA)を提案する。
論文 参考訳(メタデータ) (2025-04-22T09:22:11Z) - High-Speed Dynamic 3D Imaging with Sensor Fusion Splatting [15.309934457166394]
高速なダイナミック3Dシーンのキャプチャと再構成は、コンピュータグラフィックス、ビジョン、ロボット工学、空気力学、進化生物学などの学際分野に多くの応用がある。
従来のRGBカメラはフレームレートが低く、露出時間が限られ、ベースラインが狭い。
本稿では,RGB,深度,イベントカメラを組み合わせて高速でシーンを撮影・再構成するガウススプラッティングを用いた新しいセンサ融合手法を提案する。
論文 参考訳(メタデータ) (2025-02-07T03:17:31Z) - Discovering an Image-Adaptive Coordinate System for Photography Processing [51.164345878060956]
曲線演算を行う前にRGB色空間における画像適応座標系を学習するための新しいアルゴリズム IAC を提案する。
このエンドツーエンドのトレーニング可能なアプローチにより、共同で学習した画像適応座標系と曲線を用いて、画像の効率よく調整できる。
論文 参考訳(メタデータ) (2025-01-11T06:20:07Z) - Dynamic EventNeRF: Reconstructing General Dynamic Scenes from Multi-view RGB and Event Streams [69.65147723239153]
動的シーンのボリューム再構成はコンピュータビジョンにおいて重要な問題である。
照明が悪く、動きが速い場合には特に困難である。
本稿では,スパースなマルチビューイベントストリームとスパースなRGBフレームからシーンを時間的に再構築する手法を提案する。
論文 参考訳(メタデータ) (2024-12-09T18:56:18Z) - EventTransAct: A video transformer-based framework for Event-camera
based action recognition [52.537021302246664]
イベントカメラは、RGBビデオの標準アクション認識と比較して、新しい機会を提供する。
本研究では,最初にイベントフレーム当たりの空間埋め込みを取得するビデオトランスフォーマーネットワーク(VTN)という,計算効率のよいモデルを用いる。
イベントデータのスパースできめ細かい性質にVTNをよりよく採用するために、イベントコントラストロス(mathcalL_EC$)とイベント固有の拡張を設計する。
論文 参考訳(メタデータ) (2023-08-25T23:51:07Z) - Event Fusion Photometric Stereo Network [3.0778023655689144]
本稿では,RGBとイベントカメラを用いた環境光環境における物体の表面の正常さを推定する新しい手法を提案する。
これは、連続した光源や周囲の光環境における測光ステレオにイベントカメラを使用した最初の研究である。
論文 参考訳(メタデータ) (2023-03-01T08:13:26Z) - Self-Aligning Depth-regularized Radiance Fields for Asynchronous RGB-D Sequences [12.799443250845224]
タイムスタンプを$rm SE(3)$要素にマッピングする暗黙のネットワークである。
提案アルゴリズムは,(1)時間的関数フィッティング,(2)放射場ブートストレッピング,(3)結合ポーズ誤差補償,および放射場改良の3段階からなる。
また,ドローンによってキャプチャされた実世界の非同期RGB-Dシーケンスに対して,定性的に改善された結果を示す。
論文 参考訳(メタデータ) (2022-11-14T15:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。