論文の概要: 1000x Faster Camera and Machine Vision with Ordinary Devices
- arxiv url: http://arxiv.org/abs/2201.09302v1
- Date: Sun, 23 Jan 2022 16:10:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-25 15:48:40.639147
- Title: 1000x Faster Camera and Machine Vision with Ordinary Devices
- Title(参考訳): 通常のデバイスによる1000倍高速カメラとマシンビジョン
- Authors: Tiejun Huang, Yajing Zheng, Zhaofei Yu, Rui Chen, Yuan Li, Ruiqin
Xiong, Lei Ma, Junwei Zhao, Siwei Dong, Lin Zhu, Jianing Li, Shanshan Jia,
Yihua Fu, Boxin Shi, Si Wu and Yonghong Tian
- Abstract要約: 我々は、光子の蓄積がしきい値に達したかどうかを各ビットが示すビットシーケンスアレイであるvidarを提示する。
我々は従来のカメラより1000倍高速なヴィダーカメラを開発した。
我々はまた、マシンの速度と生物学的視覚のメカニズムを組み合わせたスパイクニューラルネットワークベースのマシンビジョンシステムを開発した。
- 参考スコア(独自算出の注目度): 76.46540270145698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In digital cameras, we find a major limitation: the image and video form
inherited from a film camera obstructs it from capturing the rapidly changing
photonic world. Here, we present vidar, a bit sequence array where each bit
represents whether the accumulation of photons has reached a threshold, to
record and reconstruct the scene radiance at any moment. By employing only
consumer-level CMOS sensors and integrated circuits, we have developed a vidar
camera that is 1,000x faster than conventional cameras. By treating vidar as
spike trains in biological vision, we have further developed a spiking neural
network-based machine vision system that combines the speed of the machine and
the mechanism of biological vision, achieving high-speed object detection and
tracking 1,000x faster than human vision. We demonstrate the utility of the
vidar camera and the super vision system in an assistant referee and target
pointing system. Our study is expected to fundamentally revolutionize the image
and video concepts and related industries, including photography, movies, and
visual media, and to unseal a new spiking neural network-enabled speed-free
machine vision era.
- Abstract(参考訳): デジタルカメラでは、大きな制限がある。フィルムカメラから継承された画像とビデオフォームは、急速に変化するフォトニックの世界を捉えるのを妨げます。
ここでは,光子の蓄積がしきい値に達したか否かを各ビットが表現し,任意のタイミングでシーンの放射を記録・再構成するビットシーケンスアレイであるvidarを提案する。
コンシューマレベルのCMOSセンサと集積回路のみを用いることで、従来のカメラより1000倍高速なビダカメラを開発した。
バイオビジョンにおけるスパイクトレインとしてvidarを取り扱うことにより、マシンの速度と生体ビジョンのメカニズムを組み合わせたスパイクニューラルネットワークベースのマシンビジョンシステムを開発し、高速物体検出を実現し、人間の視覚よりも1000倍高速に追跡する。
本稿では,vidarカメラとスーパービジョンシステムの有用性を,補助審判と目標ポインティングシステムを用いて実証する。
我々の研究は、写真、映画、ビジュアルメディアなど、画像やビデオの概念や関連産業を根本的に革新させ、新しいスパイクニューラルネットワーク対応のスピードフリーマシンビジョン時代を開封することが期待される。
関連論文リスト
- Motion Capture from Inertial and Vision Sensors [60.5190090684795]
MINIONSは、INertialとvisION Sensorsから収集された大規模なモーションキャプチャーデータセットである。
単眼カメラと極めて少ないIMUを用いたマルチモーダルモーションキャプチャの実験を行った。
論文 参考訳(メタデータ) (2024-07-23T09:41:10Z) - Microsaccade-inspired Event Camera for Robotics [42.27082276343167]
低反応時間と安定したテクスチャを同時に維持できるイベントベース認識システムの設計を行う。
回転するくさびプリズムの幾何学的光学は、追加の回転運動のアルゴリズムによる補償を可能にする。
様々な実世界の実験では、ロボット工学が低レベルと高レベルの両方の視覚タスクに対して知覚を促進する可能性を実証している。
論文 参考訳(メタデータ) (2024-05-28T02:49:46Z) - Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - Inverting the Imaging Process by Learning an Implicit Camera Model [73.81635386829846]
本稿では,ディープニューラルネットワークとしてのカメラの物理画像処理を表現した,新しい暗黙カメラモデルを提案する。
本稿では,この暗黙カメラモデルが2つの逆撮像タスクに与える影響を実演する。
論文 参考訳(メタデータ) (2023-04-25T11:55:03Z) - Deep Learning for Event-based Vision: A Comprehensive Survey and Benchmarks [55.81577205593956]
イベントカメラはバイオインスパイアされたセンサーで、ピクセルごとの強度の変化を非同期に捉える。
深層学習(DL)はこの新興分野に導入され、その可能性のマイニングに活発な研究努力にインスピレーションを与えている。
論文 参考訳(メタデータ) (2023-02-17T14:19:28Z) - Ultrafast single-channel machine vision based on neuro-inspired photonic
computing [0.0]
ニューロインスパイアされたフォトニックコンピューティングは、超低レイテンシでマシンビジョン処理を高速化するための有望なアプローチである。
本稿では,1つの入力チャネルのみで実世界の視覚情報を光学的に処理する,イメージセンサフリーなマシンビジョンフレームワークを提案する。
提案手法は高速画像認識と異常検出が可能であり,さらに高速撮像にも有効であることを示す。
論文 参考訳(メタデータ) (2023-02-15T10:08:04Z) - EDeNN: Event Decay Neural Networks for low latency vision [26.784944204163363]
我々は、元のイベントデータストリームに近く動作する新しいタイプのニューラルネットワークを開発する。
角速度回帰および競合光学流推定における最先端性能を示す。
論文 参考訳(メタデータ) (2022-09-09T15:51:39Z) - TUM-VIE: The TUM Stereo Visual-Inertial Event Dataset [50.8779574716494]
イベントカメラはバイオインスパイアされた視覚センサーで、ピクセルごとの明るさの変化を測定する。
これらは、低レイテンシ、高ダイナミックレンジ、高時間分解能、低消費電力など、従来のフレームベースのカメラよりも多くの利点を提供する。
イベントカメラを用いた3次元認識・ナビゲーションアルゴリズムの開発を促進するため,TUM-VIEデータセットを提案する。
論文 参考訳(メタデータ) (2021-08-16T19:53:56Z) - Real-Time Face & Eye Tracking and Blink Detection using Event Cameras [3.842206880015537]
イベントカメラには、各ピクセルの局所的な光強度の変化を捉え、非同期イベントのストリームを生成する、新しいニューロモルフィックな視覚センサが含まれている。
ドライバー監視システム(英: Driver monitoring system、DMS)は、ドライバーの身体的および認知状態を感知し理解するために設計されたキャビン内の安全システムである。
本稿では,運転者監視のための顔と視線を同時に検出・追跡する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-16T10:02:41Z) - Performance Evaluation of Low-Cost Machine Vision Cameras for
Image-Based Grasp Verification [0.0]
本稿では,マシンビジョンカメラを用いた視覚に基づく把握検証システムを提案する。
実験により,選択したマシンビジョンカメラとディープラーニングモデルにより,フレーム精度97%のグルーピングを堅牢に検証できることが実証された。
論文 参考訳(メタデータ) (2020-03-23T10:34:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。