論文の概要: Ultrafast single-channel machine vision based on neuro-inspired photonic
computing
- arxiv url: http://arxiv.org/abs/2302.07875v1
- Date: Wed, 15 Feb 2023 10:08:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 16:04:43.302176
- Title: Ultrafast single-channel machine vision based on neuro-inspired photonic
computing
- Title(参考訳): ニューロインスパイアフォトニックコンピューティングに基づく超高速単一チャネルマシンビジョン
- Authors: Tomoya Yamaguchi, Kohei Arai, Tomoaki Niiyama, Atsushi Uchida, and
Satoshi Sunada
- Abstract要約: ニューロインスパイアされたフォトニックコンピューティングは、超低レイテンシでマシンビジョン処理を高速化するための有望なアプローチである。
本稿では,1つの入力チャネルのみで実世界の視覚情報を光学的に処理する,イメージセンサフリーなマシンビジョンフレームワークを提案する。
提案手法は高速画像認識と異常検出が可能であり,さらに高速撮像にも有効であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-speed machine vision is increasing its importance in both scientific and
technological applications. Neuro-inspired photonic computing is a promising
approach to speed-up machine vision processing with ultralow latency. However,
the processing rate is fundamentally limited by the low frame rate of image
sensors, typically operating at tens of hertz. Here, we propose an
image-sensor-free machine vision framework, which optically processes
real-world visual information with only a single input channel, based on a
random temporal encoding technique. This approach allows for compressive
acquisitions of visual information with a single channel at gigahertz rates,
outperforming conventional approaches, and enables its direct photonic
processing using a photonic reservoir computer in a time domain. We
experimentally demonstrate that the proposed approach is capable of high-speed
image recognition and anomaly detection, and furthermore, it can be used for
high-speed imaging. The proposed approach is multipurpose and can be extended
for a wide range of applications, including tracking, controlling, and
capturing sub-nanosecond phenomena.
- Abstract(参考訳): 高速機械ビジョンは科学と技術の両方において重要性を高めている。
ニューロインスパイアされたフォトニックコンピューティングは、超低レイテンシでマシンビジョン処理をスピードアップするための有望なアプローチである。
しかし、処理速度はイメージセンサの低フレームレート(通常は数十ヘルツで動作)によって基本的に制限される。
本稿では、ランダムな時空間符号化技術に基づいて、単一の入力チャネルのみを用いて、実世界の視覚情報を光学的に処理する画像センサフリーマシンビジョンフレームワークを提案する。
このアプローチは、ギガヘルツレートで単一のチャネルで視覚情報を圧縮的に取得し、従来のアプローチよりも優れ、フォトニック貯水池コンピュータを時間領域で直接フォトニック処理することができる。
本研究では,提案手法が高速画像認識と異常検出が可能であることを実験的に証明し,さらに高速画像検出に使用できることを示す。
提案手法は多目的であり,ナノ秒以下の現象の追跡,制御,キャプチャなど,幅広い用途に拡張可能である。
関連論文リスト
- Optical training of large-scale Transformers and deep neural networks with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、このアルゴリズムの中央動作である大規模ランダム行列乗算を最大1500テラOpsで行う。
我々は、ハイブリッド光アプローチの計算スケーリングについて検討し、超深度・広帯域ニューラルネットワークの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - Latent Space Imaging [15.435034286180295]
我々は,人工視覚システムの開発において,同様のアプローチを採用することを提案する。
遅延空間イメージング(Latent Space Imaging)は、光学とソフトウェアの組み合わせによって、画像情報を生成モデルの意味的にリッチな潜在空間に直接エンコードする新しいパラダイムである。
我々は,この新原理を,1画素カメラをベースとした初期ハードウェアプロトタイプを通じて実証する。
論文 参考訳(メタデータ) (2024-07-09T17:17:03Z) - Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - Real-Time Model-Based Quantitative Ultrasound and Radar [65.268245109828]
本稿では,波動伝搬の物理モデルに基づくニューラルネットワークを提案し,受信信号と物理特性の関係を定義した。
我々のネットワークは、複雑で現実的なシナリオのために、1秒未満で複数の物理的特性を再構築することができる。
論文 参考訳(メタデータ) (2024-02-16T09:09:16Z) - Intelligent Multi-channel Meta-imagers for Accelerating Machine Vision [8.401693241238101]
計算コストのかかる畳み込み処理を高速かつ低消費電力の光学系にオフロードするために,デジタルバックエンドと協調して動作するインテリジェントなメタイメージを実証する。
メタイメージングはオブジェクト分類に使用され、手書き文字の正確な分類は98.6%、ファッション画像の分類は88.8%である。
論文 参考訳(メタデータ) (2023-06-12T18:44:08Z) - Deep learning at the edge enables real-time streaming ptychographic
imaging [7.4083593332068975]
プチコグラフィーのようなコヒーレントな顕微鏡技術は、ナノスケールの材料特性に革命をもたらす可能性がある。
従来のアプローチでは、高速コヒーレントイメージング実験からサンプル画像をリアルタイムで回収するのに十分ではない。
ここでは、エッジでの人工知能と高性能コンピューティングを活用して、検出器から直接最大2kHzでストリーミングされるX線写真データのリアルタイムインバージョンを可能にするワークフローを実演する。
論文 参考訳(メタデータ) (2022-09-20T02:02:37Z) - Nanoscale Architecture for Frequency-Resolving Single-Photon Detectors [0.0]
光検出器アーキテクチャにおいて光子場と協調的に相互作用するナノスケール素子は、高効率、低ジッタ、高周波数分解能を同時に達成できることを示す。
可視域における1eV帯域での周波数分解能の潜在的な性能について, ほぼ完全な検出効率, 数百フェムト秒のジッタ, 数十MeVの周波数分解能を示す。
論文 参考訳(メタデータ) (2022-05-12T00:48:54Z) - 1000x Faster Camera and Machine Vision with Ordinary Devices [76.46540270145698]
我々は、光子の蓄積がしきい値に達したかどうかを各ビットが示すビットシーケンスアレイであるvidarを提示する。
我々は従来のカメラより1000倍高速なヴィダーカメラを開発した。
我々はまた、マシンの速度と生物学的視覚のメカニズムを組み合わせたスパイクニューラルネットワークベースのマシンビジョンシステムを開発した。
論文 参考訳(メタデータ) (2022-01-23T16:10:11Z) - Photonic neural field on a silicon chip: large-scale, high-speed
neuro-inspired computing and sensing [0.0]
フォトニックニューラルネットワークは、低レイテンシと超低エネルギー消費で高速なニューラル処理を実現する大きな可能性を秘めている。
本稿では、フォトニック・ニューラルフィールドの概念を提案し、シリコンチップ上で実験的に実装し、高度にスケーラブルなニューラルインスピレーションド・コンピューティングを実現する。
本研究では,オンチップ・フォトニック・ニューラルフィールドを情報の保存手段として使用し,低誤差でカオス時系列予測を行う。
論文 参考訳(メタデータ) (2021-05-22T09:28:51Z) - Photonic reservoir computer based on frequency multiplexing [56.663315405998354]
本稿では、周波数領域多重化を利用してニューロン状態を符号化する貯水池コンピュータのフォトニック実装について報告する。
このシステムは同時に25個のコムライン(すなわち25個のニューロン)を20MHzの速度で処理する。
論文 参考訳(メタデータ) (2020-08-25T19:30:42Z) - End-to-end Learning for Inter-Vehicle Distance and Relative Velocity
Estimation in ADAS with a Monocular Camera [81.66569124029313]
本稿では,ディープニューラルネットワークのエンドツーエンドトレーニングに基づくカメラによる車間距離と相対速度推定手法を提案する。
提案手法の重要な特徴は,2つの時間的単眼フレームによって提供される複数の視覚的手がかりの統合である。
また,移動場における視線歪みの影響を緩和する車両中心サンプリング機構を提案する。
論文 参考訳(メタデータ) (2020-06-07T08:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。