論文の概要: Intelligent Multi-channel Meta-imagers for Accelerating Machine Vision
- arxiv url: http://arxiv.org/abs/2306.07365v1
- Date: Mon, 12 Jun 2023 18:44:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 16:09:07.448753
- Title: Intelligent Multi-channel Meta-imagers for Accelerating Machine Vision
- Title(参考訳): マシンビジョンを高速化するインテリジェントマルチチャネルメタイメージ
- Authors: Hanyu Zheng, Quan Liu, Ivan I. Kravchenko, Xiaomeng Zhang, Yuankai
Huo, and Jason G. Valentine
- Abstract要約: 計算コストのかかる畳み込み処理を高速かつ低消費電力の光学系にオフロードするために,デジタルバックエンドと協調して動作するインテリジェントなメタイメージを実証する。
メタイメージングはオブジェクト分類に使用され、手書き文字の正確な分類は98.6%、ファッション画像の分類は88.8%である。
- 参考スコア(独自算出の注目度): 8.401693241238101
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rapid developments in machine vision have led to advances in a variety of
industries, from medical image analysis to autonomous systems. These
achievements, however, typically necessitate digital neural networks with heavy
computational requirements, which are limited by high energy consumption and
further hinder real-time decision-making when computation resources are not
accessible. Here, we demonstrate an intelligent meta-imager that is designed to
work in concert with a digital back-end to off-load computationally expensive
convolution operations into high-speed and low-power optics. In this
architecture, metasurfaces enable both angle and polarization multiplexing to
create multiple information channels that perform positive and negatively
valued convolution operations in a single shot. The meta-imager is employed for
object classification, experimentally achieving 98.6% accurate classification
of handwritten digits and 88.8% accuracy in classifying fashion images. With
compactness, high speed, and low power consumption, this approach could find a
wide range of applications in artificial intelligence and machine vision
applications.
- Abstract(参考訳): 機械ビジョンの急速な発展は、医療画像分析から自律システムまで、様々な産業の進歩につながっている。
しかし、これらの成果は一般的に、高エネルギー消費によって制限され、計算資源にアクセスできない場合のリアルタイムな意思決定を阻害する重い計算要求を持つデジタルニューラルネットワークを必要とする。
本稿では,計算コストの高い畳み込み操作を高速・低消費電力の光学系に組み込むための,ディジタルバックエンドと連携して動作するインテリジェントなメタイメージ器を示す。
このアーキテクチャでは、メタサーフェスによって角度と偏波の多重化が可能となり、単一のショットで正の値と負の値を持つ畳み込み操作を行う複数の情報チャネルを作成できる。
メタイメージングはオブジェクト分類に使用され、手書き文字の正確な分類は98.6%、ファッション画像の分類は88.8%である。
小型化、高速化、低消費電力化により、このアプローチは人工知能や機械ビジョンの応用に幅広い応用を見出すことができる。
関連論文リスト
- Computed tomography using meta-optics [2.0771751014539532]
コンピュータビジョンタスクは、画像分類、セグメンテーション、特徴抽出を行うために大量のデータを処理する必要がある。
光プリプロセッサはコンピュータビジョンタスクに必要な浮動小数点演算数を削減できる可能性がある。
本稿では,視力訓練の必要性を回避したラドン変換を実装したメタオプティカル・イメージラを提案する。
論文 参考訳(メタデータ) (2024-11-13T19:34:10Z) - Metasurface-generated large and arbitrary analog convolution kernels for accelerated machine vision [10.201372470332501]
任意形状のアナログ畳み込みカーネルを作成するための空間周波数領域訓練法を開発した。
MNISTデータセットの98.59%の分類精度を実験的に証明し、シミュレーションでは92.63%と68.67%の精度を示した。
この研究はアナログ光学的畳み込みの独特な利点を浮き彫りにして、機械ビジョンタスクを加速する有望な道を提供する。
論文 参考訳(メタデータ) (2024-09-27T10:24:19Z) - Optical training of large-scale Transformers and deep neural networks with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、このアルゴリズムの中央動作である大規模ランダム行列乗算を最大1500テラOpsで行う。
我々は、ハイブリッド光アプローチの計算スケーリングについて検討し、超深度・広帯域ニューラルネットワークの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - Artificial intelligence optical hardware empowers high-resolution
hyperspectral video understanding at 1.2 Tb/s [53.91923493664551]
本研究は,多次元映像理解のためのハードウェアアクセラレーション型集積光電子プラットフォームをリアルタイムに導入する。
この技術プラットフォームは、人工知能ハードウェアと光学的に情報を処理し、最先端のマシンビジョンネットワークを組み合わせる。
このような性能は、類似のスペクトル分解能を持つ最も近い技術の速度を3~4等級で上回る。
論文 参考訳(メタデータ) (2023-12-17T07:51:38Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Volcanic ash delimitation using Artificial Intelligence based on Pix2Pix [0.0]
火山噴火は、人間の健康に有害な灰を放出し、インフラ、経済活動、環境に損傷を与える。
灰雲の昇華により、その挙動や分散を知ることができ、この現象の防止と緩和に役立つ。
本研究は、入力画像の出力画像へのマッピングを学習する生成的敵対ネットワークの一種であるPix2Pixモデルの使用を提案する。
論文 参考訳(メタデータ) (2023-07-24T17:49:04Z) - Ultrafast single-channel machine vision based on neuro-inspired photonic
computing [0.0]
ニューロインスパイアされたフォトニックコンピューティングは、超低レイテンシでマシンビジョン処理を高速化するための有望なアプローチである。
本稿では,1つの入力チャネルのみで実世界の視覚情報を光学的に処理する,イメージセンサフリーなマシンビジョンフレームワークを提案する。
提案手法は高速画像認識と異常検出が可能であり,さらに高速撮像にも有効であることを示す。
論文 参考訳(メタデータ) (2023-02-15T10:08:04Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - Scalable Optical Learning Operator [0.2399911126932526]
提案するフレームワークは,速度を分類することなく既存のシステムのエネルギースケーリング問題を克服する。
数値的および実験的に、デジタル実装に匹敵する精度で複数の異なるタスクを実行する方法の能力を示した。
その結果、マルチモードファイバベースのコンピュータの性能を複製するには、強力なスーパーコンピュータが必要であることが示された。
論文 参考訳(メタデータ) (2020-12-22T23:06:59Z) - Photonics for artificial intelligence and neuromorphic computing [52.77024349608834]
フォトニック集積回路は超高速な人工ニューラルネットワークを可能にした。
フォトニックニューロモルフィックシステムはナノ秒以下のレイテンシを提供する。
これらのシステムは、機械学習と人工知能の需要の増加に対応する可能性がある。
論文 参考訳(メタデータ) (2020-10-30T21:41:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。