論文の概要: PulseDL-II: A System-on-Chip Neural Network Accelerator for Timing and
Energy Extraction of Nuclear Detector Signals
- arxiv url: http://arxiv.org/abs/2209.00884v1
- Date: Fri, 2 Sep 2022 08:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 13:01:12.122092
- Title: PulseDL-II: A System-on-Chip Neural Network Accelerator for Timing and
Energy Extraction of Nuclear Detector Signals
- Title(参考訳): pulsedl-ii:核検出器信号のタイミングとエネルギー抽出のためのシステムオンチップニューラルネットワークアクセラレータ
- Authors: Pengcheng Ai, Zhi Deng, Yi Wang, Hui Gong, Xinchi Ran, Zijian Lang
- Abstract要約: 本稿では,深層学習を持つパルスからイベント特徴(時間,エネルギーなど)を抽出するためのシステムオンチップ(SoC)であるPulseDL-IIを紹介する。
提案システムは, 47.4dBの信号対雑音比(SNR)において, オンラインニューラルネットワークを用いた60psの時間分解能と0.40%のエネルギー分解能を得た。
- 参考スコア(独自算出の注目度): 3.307097167756987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Front-end electronics equipped with high-speed digitizers are being used and
proposed for future nuclear detectors. Recent literature reveals that deep
learning models, especially one-dimensional convolutional neural networks, are
promising when dealing with digital signals from nuclear detectors. Simulations
and experiments demonstrate the satisfactory accuracy and additional benefits
of neural networks in this area. However, specific hardware accelerating such
models for online operations still needs to be studied. In this work, we
introduce PulseDL-II, a system-on-chip (SoC) specially designed for
applications of event feature (time, energy, etc.) extraction from pulses with
deep learning. Based on the previous version, PulseDL-II incorporates a RISC
CPU into the system structure for better functional flexibility and integrity.
The neural network accelerator in the SoC adopts a three-level (arithmetic
unit, processing element, neural network) hierarchical architecture and
facilitates parameter optimization of the digital design. Furthermore, we
devise a quantization scheme and associated implementation methods (rescale &
bit-shift) for full compatibility with deep learning frameworks (e.g.,
TensorFlow) within a selected subset of layer types. With the current scheme,
the quantization-aware training of neural networks is supported, and network
models are automatically transformed into software of RISC CPU by dedicated
scripts, with nearly no loss of accuracy. We validate PulseDL-II on field
programmable gate arrays (FPGA). Finally, system validation is done with an
experimental setup made up of a direct digital synthesis (DDS) signal generator
and an FPGA development board with analog-to-digital converters (ADC). The
proposed system achieved 60 ps time resolution and 0.40% energy resolution with
online neural network inference at signal to noise ratio (SNR) of 47.4 dB.
- Abstract(参考訳): 高速デジタイザを備えたフロントエンド電子は、将来の核検出器として使われ提案されている。
近年の文献では、深層学習モデル、特に1次元畳み込みニューラルネットワークが核検出器からのデジタル信号を扱う際に有望であることが示されている。
シミュレーションと実験は、この分野におけるニューラルネットワークの十分な精度と追加の利点を示す。
しかし、そのようなモデルをオンライン操作に加速する特定のハードウェアは、まだ研究が必要である。
本稿では,パルスからのイベント特徴(時間,エネルギーなど)抽出を深層学習に応用するために特別に設計されたシステムオンチップ(soc)である pulsedl-ii を紹介する。
以前のバージョンに基づいて、PulseDL-IIはRISC CPUをシステム構造に組み込んで、機能的柔軟性と整合性を向上させる。
SoCのニューラルネットワークアクセラレータは、階層アーキテクチャの3レベル(パラメータ単位、処理要素、ニューラルネットワーク)を採用し、デジタル設計のパラメータ最適化を容易にする。
さらに,階層型の選択されたサブセット内でのディープラーニングフレームワーク(TensorFlowなど)との完全な互換性を実現するために,量子化スキームと関連する実装方法(再スケールとビットシフト)を考案する。
現在のスキームでは、ニューラルネットワークの量子化対応トレーニングがサポートされ、ネットワークモデルは、ほぼ精度を失うことなく、専用のスクリプトによってRISC CPUのソフトウェアに自動的に変換される。
我々はフィールドプログラマブルゲートアレイ(FPGA)上でPulseDL-IIを検証する。
最後に、直接デジタル合成(dds)信号発生器とアナログ-デジタル変換器(adc)を備えたfpga開発基板からなる実験的な構成でシステム検証を行う。
提案システムは,信号対雑音比(SNR)47.4dBのオンラインニューラルネットワークを用いた60psの時間分解能と0.40%のエネルギー分解能を得た。
関連論文リスト
- Adaptive Robotic Arm Control with a Spiking Recurrent Neural Network on a Digital Accelerator [41.60361484397962]
本稿では,システムの概要と,Pynq ZUプラットフォーム上で使用するPythonフレームワークについて述べる。
シミュレーションされた精度は,毎秒380万イベントのピーク性能で維持されていることを示す。
論文 参考訳(メタデータ) (2024-05-21T14:59:39Z) - Neuromorphic Split Computing with Wake-Up Radios: Architecture and Design via Digital Twinning [97.99077847606624]
本研究は,遠隔・無線接続型NPUからなる分割計算機システムに,覚醒無線機構を組み込んだ新しいアーキテクチャを提案する。
覚醒無線に基づくニューロモルフィックスプリットコンピューティングシステムの設計における重要な課題は、検知、覚醒信号検出、意思決定のためのしきい値の選択である。
論文 参考訳(メタデータ) (2024-04-02T10:19:04Z) - ClST: A Convolutional Transformer Framework for Automatic Modulation
Recognition by Knowledge Distillation [23.068233043023834]
本稿では、畳み込み結合型信号変換器(ClST)という新しいニューラルネットワークと、信号知識蒸留(SKD)という新しい知識蒸留法を提案する。
SKDは、ニューラルネットワークのパラメータと複雑さを効果的に削減する知識蒸留法である。
我々は、SKDアルゴリズムであるKD-CNNとKD-MobileNetを使って、2つの軽量ニューラルネットワークをトレーニングし、ニューラルネットワークを小型デバイスで使用できるという要求を満たす。
論文 参考訳(メタデータ) (2023-12-29T03:01:46Z) - DYNAP-SE2: a scalable multi-core dynamic neuromorphic asynchronous
spiking neural network processor [2.9175555050594975]
我々は、リアルタイムイベントベーススパイキングニューラルネットワーク(SNN)をプロトタイピングするための、脳にインスパイアされたプラットフォームを提案する。
提案システムは, 短期可塑性, NMDA ゲーティング, AMPA拡散, ホメオスタシス, スパイク周波数適応, コンダクタンス系デンドライトコンパートメント, スパイク伝達遅延などの動的および現実的なニューラル処理現象の直接エミュレーションを支援する。
異なる生物学的に可塑性のニューラルネットワークをエミュレートする柔軟性と、個体群と単一ニューロンの信号の両方をリアルタイムで監視する能力により、基礎研究とエッジコンピューティングの両方への応用のための複雑なニューラルネットワークモデルの開発と検証が可能になる。
論文 参考訳(メタデータ) (2023-10-01T03:48:16Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - Deep Convolutional Learning-Aided Detector for Generalized Frequency
Division Multiplexing with Index Modulation [0.0]
提案手法は、まずゼロフォース検出器(ZF)を用いて受信信号を前処理し、その後、畳み込みニューラルネットワーク(CNN)と完全連結ニューラルネットワーク(FCNN)からなるニューラルネットワークを用いる。
FCNN部は2つの完全に接続された層しか使用せず、複雑さとBER(bit error rate)パフォーマンスのトレードオフをもたらすことができる。
提案したディープ畳み込みニューラルネットワークに基づく検出・復調方式は,ZF検出器よりも高いBER性能を示し,複雑性が増大することが実証されている。
論文 参考訳(メタデータ) (2022-02-06T22:18:42Z) - Two-Timescale End-to-End Learning for Channel Acquisition and Hybrid
Precoding [94.40747235081466]
本研究では,ミリ波(mmWave)大規模マルチインプット多重出力(MIMO)システムのためのエンドツーエンドの深層学習に基づくジョイントトランスシーバ設計アルゴリズムを提案する。
我々は受信したパイロットを受信機でフィードバックビットにマッピングし、さらに送信機でハイブリッドプリコーダにフィードバックビットをマッピングするDNNアーキテクチャを開発した。
論文 参考訳(メタデータ) (2021-10-22T20:49:02Z) - A quantum algorithm for training wide and deep classical neural networks [72.2614468437919]
勾配勾配勾配による古典的トレーサビリティに寄与する条件は、量子線形系を効率的に解くために必要な条件と一致することを示す。
MNIST画像データセットがそのような条件を満たすことを数値的に示す。
我々は、プールを用いた畳み込みニューラルネットワークのトレーニングに$O(log n)$の実証的証拠を提供する。
論文 参考訳(メタデータ) (2021-07-19T23:41:03Z) - Decentralizing Feature Extraction with Quantum Convolutional Neural
Network for Automatic Speech Recognition [101.69873988328808]
特徴抽出のための量子回路エンコーダからなる量子畳み込みニューラルネットワーク(QCNN)を構築した。
入力音声はまず、Mel-spectrogramを抽出するために量子コンピューティングサーバにアップストリームされる。
対応する畳み込み特徴は、ランダムパラメータを持つ量子回路アルゴリズムを用いて符号化される。
符号化された機能は、最終認識のためにローカルRNNモデルにダウンストリームされる。
論文 参考訳(メタデータ) (2020-10-26T03:36:01Z) - Training End-to-End Analog Neural Networks with Equilibrium Propagation [64.0476282000118]
本稿では,勾配降下による終端から終端までのアナログニューラルネットワークの学習法を提案する。
数学的には、アナログニューラルネットワークのクラス(非線形抵抗性ネットワークと呼ばれる)がエネルギーベースモデルであることが示される。
我々の研究は、オンチップ学習をサポートする、超高速でコンパクトで低消費電力のニューラルネットワークの新世代の開発を導くことができる。
論文 参考訳(メタデータ) (2020-06-02T23:38:35Z) - Compressing deep neural networks on FPGAs to binary and ternary
precision with HLS4ML [13.325670094073383]
本稿では, hls4mlライブラリにおける2次ニューラルネットワークと3次ニューラルネットワークの実装について述べる。
モデル精度と資源消費のトレードオフについて論じる。
二分法と三分法の実装は、FPGAリソースを劇的に減らしながら高い精度の実装と類似した性能を持つ。
論文 参考訳(メタデータ) (2020-03-11T10:46:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。