論文の概要: Hardware, Algorithms, and Applications of the Neuromorphic Vision Sensor: a Review
- arxiv url: http://arxiv.org/abs/2504.08588v1
- Date: Fri, 11 Apr 2025 14:46:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:18:41.495424
- Title: Hardware, Algorithms, and Applications of the Neuromorphic Vision Sensor: a Review
- Title(参考訳): ニューロモルフィック視覚センサのハードウェア・アルゴリズム・応用
- Authors: Claudio Cimarelli, Jose Andres Millan-Romera, Holger Voos, Jose Luis Sanchez-Lopez,
- Abstract要約: ニューロモルフィック(Neuromorphic)またはイベントカメラは、検出された1ピクセル当たりの瞬時照明変化をイベントパケットの非同期ストリームに変換する視覚センシングエンコードに対する古典的なアプローチの変換を表す。
彼らの斬新さは、フル画像フレームを一定時間間隔でキャプチャするから、スパースなデータフォーマットへの移行にある。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Neuromorphic, or event, cameras represent a transformation in the classical approach to visual sensing encodes detected instantaneous per-pixel illumination changes into an asynchronous stream of event packets. Their novelty compared to standard cameras lies in the transition from capturing full picture frames at fixed time intervals to a sparse data format which, with its distinctive qualities, offers potential improvements in various applications. However, these advantages come at the cost of reinventing algorithmic procedures or adapting them to effectively process the new data format. In this survey, we systematically examine neuromorphic vision along three main dimensions. First, we highlight the technological evolution and distinctive hardware features of neuromorphic cameras from their inception to recent models. Second, we review image processing algorithms developed explicitly for event-based data, covering key works on feature detection, tracking, and optical flow -which form the basis for analyzing image elements and transformations -as well as depth and pose estimation or object recognition, which interpret more complex scene structures and components. These techniques, drawn from classical computer vision and modern data-driven approaches, are examined to illustrate the breadth of applications for event-based cameras. Third, we present practical application case studies demonstrating how event cameras have been successfully used across various industries and scenarios. Finally, we analyze the challenges limiting widespread adoption, identify significant research gaps compared to standard imaging techniques, and outline promising future directions and opportunities that neuromorphic vision offers.
- Abstract(参考訳): ニューロモルフィック(Neuromorphic)またはイベントカメラは、検出された1ピクセル当たりの瞬時照明変化をイベントパケットの非同期ストリームに変換する視覚センシングエンコードに対する古典的なアプローチの変換を表す。
標準的なカメラに比べて斬新な点は、固定時間間隔でフル画像フレームをキャプチャするところから、その特徴的な特性によって、様々なアプリケーションに潜在的な改善をもたらすスパースデータフォーマットへの移行にある。
しかし、これらのアドバンテージは、アルゴリズムプロシージャを再発明したり、新しいデータフォーマットを効果的に処理するためにそれらを適用するコストがかかる。
本研究では,3つの主次元に沿った神経型視覚を系統的に検討する。
まず、ニューロモルフィックカメラの登場から最近のモデルまで、技術的進化と特徴あるハードウェアの特徴を強調した。
第2に、イベントベースのデータに対して明示的に開発された画像処理アルゴリズムについて、特徴の検出、追跡、光学フロー(画像要素や変換を解析するための基盤となる)、さらに複雑なシーン構造やコンポーネントを解釈する深度やポーズ推定、オブジェクト認識(オブジェクト認識)について概説する。
これらの技術は,従来のコンピュータビジョンと現代のデータ駆動型アプローチから抽出され,イベントベースカメラの応用の広さを実証するために検討されている。
第3に,様々な産業・シナリオでイベントカメラの活用が成功していることを示す実践的応用事例について述べる。
最後に、広範に採用されるのを制限する課題を分析し、標準的な画像技術と比較して重要な研究ギャップを特定し、ニューロモルフィック・ビジョンがもたらす将来的な方向性と機会を概説する。
関連論文リスト
- Descriptor: Face Detection Dataset for Programmable Threshold-Based Sparse-Vision [0.8271394038014485]
このデータセットは、Aff-Wild2で使用されるのと同じビデオから派生した顔検出タスクのための注釈付き、時間閾値ベースの視覚データセットである。
我々は,このリソースが時間差閾値に基づいて処理できるスマートセンサに基づく堅牢な視覚システムの開発を支援することを期待する。
論文 参考訳(メタデータ) (2024-10-01T03:42:03Z) - Research, Applications and Prospects of Event-Based Pedestrian Detection: A Survey [10.494414329120909]
生物学的網膜にインスパイアされたイベントベースのカメラは、最小限の電力要求、無視できるレイテンシ、時間分解能、拡張可能なダイナミックレンジによって区別される最先端のセンサーへと進化してきた。
イベントベースのカメラは、高速撮像のシナリオにおいて、外部データ伝送を誘発し、動きのぼやけをなくすことによって制限に対処する。
本稿では,特に自律運転における研究と応用について概観する。
論文 参考訳(メタデータ) (2024-07-05T06:17:00Z) - Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - Neuromorphic Face Analysis: a Survey [26.357357272526322]
イベントカメラ(英: event camera)またはニューロモルフィックセンサー(英: Neuromorphic sensor)は、生物学的視覚系の機能を模倣する撮像装置の一種である。
これらの特性は、有効性とプライバシー保護の観点から、人間の顔のモデリングにおいて興味深いことが証明されている。
本稿では,ニューロモルフィック顔分析分野における機能,課題,新たな応用について概説する。
論文 参考訳(メタデータ) (2024-02-18T16:17:25Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Deep Learning for Event-based Vision: A Comprehensive Survey and Benchmarks [55.81577205593956]
イベントカメラはバイオインスパイアされたセンサーで、ピクセルごとの強度の変化を非同期に捉える。
深層学習(DL)はこの新興分野に導入され、その可能性のマイニングに活発な研究努力にインスピレーションを与えている。
論文 参考訳(メタデータ) (2023-02-17T14:19:28Z) - Recognizing Actions in Videos from Unseen Viewpoints [80.6338404141284]
本研究では,現在の畳み込みニューラルネットワークモデルでは,トレーニングデータに存在しないカメラ視点からの動作を認識できないことを示す。
視認不能な認識のための新しいデータセットを導入し、視点不変表現を学習するアプローチ能力を示す。
論文 参考訳(メタデータ) (2021-03-30T17:17:54Z) - Translate to Adapt: RGB-D Scene Recognition across Domains [18.40373730109694]
本研究では,マルチモーダルシーン認識データセット内に,潜在的に深刻なドメインシフト問題が存在することを注目する。
本稿では,異なるカメラ領域にまたがって適応可能な自己教師付きモダリティ間翻訳法を提案する。
論文 参考訳(メタデータ) (2021-03-26T18:20:29Z) - Wide-angle Image Rectification: A Survey [86.36118799330802]
広角画像は、基礎となるピンホールカメラモデルに反する歪みを含む。
これらの歪みを補正することを目的とした画像修正は、これらの問題を解決することができる。
本稿では、異なるアプローチで使用されるカメラモデルについて、詳細な説明と議論を行う。
次に,従来の幾何学に基づく画像修正手法と深層学習法の両方について検討する。
論文 参考訳(メタデータ) (2020-10-30T17:28:40Z) - Learning Monocular Dense Depth from Events [53.078665310545745]
イベントカメラは、強度フレームではなく、非同期イベントのストリームの形式で輝度を変化させる。
最近の学習に基づくアプローチは、単眼深度予測のようなイベントベースのデータに適用されている。
本稿では,この課題を解決するための繰り返しアーキテクチャを提案し,標準フィードフォワード法よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-10-16T12:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。