論文の概要: Deep Photonic Reservoir Computer for Speech Recognition
- arxiv url: http://arxiv.org/abs/2312.06558v1
- Date: Mon, 11 Dec 2023 17:43:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 14:42:54.765439
- Title: Deep Photonic Reservoir Computer for Speech Recognition
- Title(参考訳): 音声認識用深部フォトニック貯水池コンピュータ
- Authors: Enrico Picco, Alessandro Lupo, Serge Massar
- Abstract要約: 音声認識は人工知能の分野で重要な課題であり、目覚ましい進歩を目撃してきた。
深い貯水池コンピューティングはエネルギー効率が高いが、よりリソース集約的な機械学習アルゴリズムと比較して、パフォーマンスに制限がある。
フォトニック方式の深層貯水池コンピュータを提案し,その性能を音声認識タスクで評価する。
- 参考スコア(独自算出の注目度): 49.1574468325115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech recognition is a critical task in the field of artificial intelligence
and has witnessed remarkable advancements thanks to large and complex neural
networks, whose training process typically requires massive amounts of labeled
data and computationally intensive operations. An alternative paradigm,
reservoir computing, is energy efficient and is well adapted to implementation
in physical substrates, but exhibits limitations in performance when compared
to more resource-intensive machine learning algorithms. In this work we address
this challenge by investigating different architectures of interconnected
reservoirs, all falling under the umbrella of deep reservoir computing. We
propose a photonic-based deep reservoir computer and evaluate its effectiveness
on different speech recognition tasks. We show specific design choices that aim
to simplify the practical implementation of a reservoir computer while
simultaneously achieving high-speed processing of high-dimensional audio
signals. Overall, with the present work we hope to help the advancement of
low-power and high-performance neuromorphic hardware.
- Abstract(参考訳): 音声認識は人工知能の分野では重要な課題であり、大規模で複雑なニューラルネットワークのおかげで驚くべき進歩を遂げている。
代替のパラダイムである貯水池コンピューティングはエネルギー効率が高く、物理基板の実装に適しているが、よりリソース集約的な機械学習アルゴリズムと比較して性能に制限がある。
本研究では,相互接続型貯水池の異なるアーキテクチャを調査することで,この課題に対処した。
フォトニック方式の深層貯水池コンピュータを提案し,その性能を音声認識タスクで評価する。
本研究では,高次元音声信号の高速処理を同時に実現しつつ,貯水池コンピュータの実装を簡略化することを目的とした設計選択について述べる。
全体として、本研究により、低消費電力で高性能なニューロモルフィックハードウェアの開発を支援したいと考えています。
関連論文リスト
- Computation-efficient Deep Learning for Computer Vision: A Survey [121.84121397440337]
ディープラーニングモデルは、さまざまな視覚的知覚タスクにおいて、人間レベルのパフォーマンスに到達または超えた。
ディープラーニングモデルは通常、重要な計算資源を必要とし、現実のシナリオでは非現実的な電力消費、遅延、または二酸化炭素排出量につながる。
新しい研究の焦点は計算効率のよいディープラーニングであり、推論時の計算コストを最小限に抑えつつ、良好な性能を達成することを目指している。
論文 参考訳(メタデータ) (2023-08-27T03:55:28Z) - Brain-Inspired Computational Intelligence via Predictive Coding [89.6335791546526]
予測符号化(PC)は、マシンインテリジェンスタスクにおいて有望なパフォーマンスを示している。
PCは様々な脳領域で情報処理をモデル化することができ、認知制御やロボティクスで使用することができる。
論文 参考訳(メタデータ) (2023-08-15T16:37:16Z) - Enable Deep Learning on Mobile Devices: Methods, Systems, and
Applications [46.97774949613859]
ディープニューラルネットワーク(DNN)は人工知能(AI)分野において前例のない成功を収めた
しかし、それらの優れた性能は、計算の複雑さのかなりのコストを伴っている。
本稿では,効率的なディープラーニング手法,システム,応用について概説する。
論文 参考訳(メタデータ) (2022-04-25T16:52:48Z) - Scalable Optical Learning Operator [0.2399911126932526]
提案するフレームワークは,速度を分類することなく既存のシステムのエネルギースケーリング問題を克服する。
数値的および実験的に、デジタル実装に匹敵する精度で複数の異なるタスクを実行する方法の能力を示した。
その結果、マルチモードファイバベースのコンピュータの性能を複製するには、強力なスーパーコンピュータが必要であることが示された。
論文 参考訳(メタデータ) (2020-12-22T23:06:59Z) - Speech Command Recognition in Computationally Constrained Environments
with a Quadratic Self-organized Operational Layer [92.37382674655942]
軽量ネットワークの音声コマンド認識能力を向上するネットワーク層を提案する。
この手法はテイラー展開と二次形式の概念を借用し、入力層と隠蔽層の両方における特徴のより良い表現を構築する。
このリッチな表現は、Google音声コマンド(GSC)と合成音声コマンド(SSC)データセットに関する広範な実験で示されているように、認識精度の向上をもたらす。
論文 参考訳(メタデータ) (2020-11-23T14:40:18Z) - TinySpeech: Attention Condensers for Deep Speech Recognition Neural
Networks on Edge Devices [71.68436132514542]
エッジ上でのオンデバイス音声認識のための低フットプリント,高効率深層ニューラルネットワーク構築のためのアテンションコンデンサの概念を紹介する。
その有効性を説明するために,デバイス上での音声認識に適した低精度深層ニューラルネットワークTinySpeechを導入する。
論文 参考訳(メタデータ) (2020-08-10T16:34:52Z) - Spiking Neural Networks Hardware Implementations and Challenges: a
Survey [53.429871539789445]
スパイキングニューラルネットワークは、ニューロンとシナプスの操作原理を模倣する認知アルゴリズムである。
スパイキングニューラルネットワークのハードウェア実装の現状について述べる。
本稿では,これらのイベント駆動アルゴリズムの特性をハードウェアレベルで活用するための戦略について論じる。
論文 参考訳(メタデータ) (2020-05-04T13:24:00Z) - Human action recognition with a large-scale brain-inspired photonic
computer [0.774229787612056]
ビデオストリームにおける人間の行動の認識は、コンピュータビジョンにおいて難しい課題である。
ディープラーニングは近年顕著な成果を上げているが、実際に使うのが難しくなっている。
本稿では,映像に基づく人間の動作を最先端の精度で認識できる,スケーラブルなフォトニックニューロインスパイアアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-06T10:39:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。