論文の概要: Accelerating Recurrent Neural Networks for Gravitational Wave
Experiments
- arxiv url: http://arxiv.org/abs/2106.14089v1
- Date: Sat, 26 Jun 2021 20:44:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 17:41:33.983260
- Title: Accelerating Recurrent Neural Networks for Gravitational Wave
Experiments
- Title(参考訳): 重力波実験のための高速リカレントニューラルネットワーク
- Authors: Zhiqiang Que, Erwei Wang, Umar Marikar, Eric Moreno, Jennifer
Ngadiuba, Hamza Javed, Bart{\l}omiej Borzyszkowski, Thea Aarrestad, Vladimir
Loncar, Sioni Summers, Maurizio Pierini, Peter Y Cheung, Wayne Luk
- Abstract要約: LIGO検出器から時系列データを解析するためのRNN推論を高速化する新しいアーキテクチャを開発した。
このアーキテクチャのためのカスタマイズ可能なテンプレートが設計され、低遅延FPGAの設計が作成できるようになった。
- 参考スコア(独自算出の注目度): 1.9263019320519579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents novel reconfigurable architectures for reducing the
latency of recurrent neural networks (RNNs) that are used for detecting
gravitational waves. Gravitational interferometers such as the LIGO detectors
capture cosmic events such as black hole mergers which happen at unknown times
and of varying durations, producing time-series data. We have developed a new
architecture capable of accelerating RNN inference for analyzing time-series
data from LIGO detectors. This architecture is based on optimizing the
initiation intervals (II) in a multi-layer LSTM (Long Short-Term Memory)
network, by identifying appropriate reuse factors for each layer. A
customizable template for this architecture has been designed, which enables
the generation of low-latency FPGA designs with efficient resource utilization
using high-level synthesis tools. The proposed approach has been evaluated
based on two LSTM models, targeting a ZYNQ 7045 FPGA and a U250 FPGA.
Experimental results show that with balanced II, the number of DSPs can be
reduced up to 42% while achieving the same IIs. When compared to other
FPGA-based LSTM designs, our design can achieve about 4.92 to 12.4 times lower
latency.
- Abstract(参考訳): 本稿では、重力波検出に使用されるリカレントニューラルネットワーク(RNN)の遅延を低減するための新しい再構成可能なアーキテクチャを提案する。
LIGO検出器のような重力干渉計は、未知の時間と様々な期間のブラックホールの融合のような宇宙現象を捉え、時系列データを生成する。
LIGO検出器から時系列データを解析するためのRNN推論を高速化する新しいアーキテクチャを開発した。
本アーキテクチャは,多層LSTM(Long Short-Term Memory)ネットワークにおける開始間隔(II)を最適化し,各層に対して適切な再利用係数を同定する。
このアーキテクチャのためのカスタマイズ可能なテンプレートが設計され、高レベル合成ツールを用いた効率的な資源利用による低レイテンシFPGA設計が実現されている。
提案手法は ZYNQ 7045 FPGA と U250 FPGA を対象とする 2 つのLSTM モデルに基づいて評価されている。
実験の結果, 平衡IIではDSPの数は42%まで減少し, 同じIIを達成できた。
他のFPGAベースのLSTM設計と比較して、我々の設計は、約4.92から12.4倍のレイテンシを実現することができる。
関連論文リスト
- rule4ml: An Open-Source Tool for Resource Utilization and Latency Estimation for ML Models on FPGA [0.0]
本稿では、FPGA上での合成と実装に先立って、ニューラルネットワーク(NN)のリソース利用と推論遅延を予測する新しい手法を提案する。
NNを高レベル合成(HLS)コードに変換するツールフローであるHLS4MLを活用している。
本手法では, 即時前合成予測に適応した回帰モデルを用いる。
論文 参考訳(メタデータ) (2024-08-09T19:35:10Z) - Coupling a Recurrent Neural Network to SPAD TCSPC Systems for Real-time
Fluorescence Lifetime Imaging [4.49533352963549]
近年,生物・医学研究における強力な診断技術として,蛍光寿命イメージング(FLI)が注目されている。
既存のFLIシステムは、処理速度、精度、堅牢性の間のトレードオフに悩まされることが多い。
精度を低下させることなく高速FLIを実現する頑健な手法を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:37:37Z) - Implementing Neural Network-Based Equalizers in a Coherent Optical
Transmission System Using Field-Programmable Gate Arrays [3.1543509940301946]
我々は、コヒーレント光伝送システムにおける非線形性補償のための、リカレントおよびフィードフォワードニューラルネットワーク(NN)ベースの等化器のオフラインFPGA実現について述べる。
主な結果は、性能比較、アクティベーション関数の実装方法の分析、ハードウェアの複雑さに関するレポートの3つに分けられる。
論文 参考訳(メタデータ) (2022-12-09T07:28:45Z) - LL-GNN: Low Latency Graph Neural Networks on FPGAs for High Energy
Physics [45.666822327616046]
本研究は,粒子検出器のための低グラフニューラルネットワーク(LL-GNN)設計のための新しい再構成可能なアーキテクチャを提案する。
LL-GNNの設計は、洗練されたアルゴリズムが実験データを効率的に処理できるようにすることで、次世代のトリガーシステムを進化させる。
論文 参考訳(メタデータ) (2022-09-28T12:55:35Z) - Ultra-low latency recurrent neural network inference on FPGAs for
physics applications with hls4ml [8.085746138965975]
本稿では,hls4mlフレームワーク内に2種類のリカレントニューラルネットワーク層 – 長期記憶とゲート再カレントユニット – を実装する。
CERN大型ハドロン衝突型加速器におけるジェット識別タスクに特化して訓練された複数のニューラルネットワークの性能と合成設計について述べる。
論文 参考訳(メタデータ) (2022-07-01T17:19:24Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks [61.76338096980383]
TDNN(State-of-the-the-art Factored Time delay Neural Network)の2種類のハイパーパラメータを自動的に学習するために、さまざまなニューラルネットワークサーチ(NAS)技術が使用されている。
DARTSメソッドはアーキテクチャ選択とLF-MMI(格子のないMMI)TDNNトレーニングを統合する。
300時間のSwitchboardコーパスで行われた実験では、自動構成システムはベースラインLF-MMI TDNNシステムより一貫して優れていることが示唆された。
論文 参考訳(メタデータ) (2020-07-17T08:32:11Z) - Object Tracking through Residual and Dense LSTMs [67.98948222599849]
LSTM(Long Short-Term Memory)リカレントニューラルネットワークに基づくディープラーニングベースのトラッカーが、強力な代替手段として登場した。
DenseLSTMはResidualおよびRegular LSTMより優れ、ニュアンセに対する高いレジリエンスを提供する。
ケーススタディは、他のトラッカーの堅牢性を高めるために残差ベースRNNの採用を支援する。
論文 参考訳(メタデータ) (2020-06-22T08:20:17Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。