論文の概要: Fast inference of Boosted Decision Trees in FPGAs for particle physics
- arxiv url: http://arxiv.org/abs/2002.02534v2
- Date: Wed, 19 Feb 2020 11:47:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 22:04:41.084072
- Title: Fast inference of Boosted Decision Trees in FPGAs for particle physics
- Title(参考訳): 粒子物理学のためのFPGAにおけるブースト決定木の高速推定
- Authors: Sioni Summers, Giuseppe Di Guglielmo, Javier Duarte, Philip Harris,
Duc Hoang, Sergo Jindariani, Edward Kreinar, Vladimir Loncar, Jennifer
Ngadiuba, Maurizio Pierini, Dylan Rankin, Nhan Tran, Zhenbin Wu
- Abstract要約: 本稿では, hls4mlライブラリにおけるブースト決定木の実装について述べる。
完全なオンチップ実装のおかげで、hls4mlは極めて低レイテンシでBoosted Decision Treeモデルの推論を実行する。
このソリューションは、コライダー実験のLevel-1 TriggerシステムのようなFPGAベースのリアルタイム処理に適している。
- 参考スコア(独自算出の注目度): 11.99846367249951
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We describe the implementation of Boosted Decision Trees in the hls4ml
library, which allows the translation of a trained model into FPGA firmware
through an automated conversion process. Thanks to its fully on-chip
implementation, hls4ml performs inference of Boosted Decision Tree models with
extremely low latency. With a typical latency less than 100 ns, this solution
is suitable for FPGA-based real-time processing, such as in the Level-1 Trigger
system of a collider experiment. These developments open up prospects for
physicists to deploy BDTs in FPGAs for identifying the origin of jets, better
reconstructing the energies of muons, and enabling better selection of rare
signal processes.
- Abstract(参考訳): 本稿では、 hls4mlライブラリにおけるブースト決定木の実装について述べる。これにより、自動変換プロセスにより、トレーニングされたモデルをFPGAファームウェアに変換することができる。
完全なオンチップ実装のおかげで、hls4mlは極めて低レイテンシでBoosted Decision Treeモデルの推論を実行する。
典型的なレイテンシが100 ns未満であるこのソリューションは、コライダー実験のLevel-1 TriggerシステムのようなFPGAベースのリアルタイム処理に適している。
これらの発展は、物理学者がBDTをFPGAに展開し、ジェットの起源を特定し、ミューオンのエネルギーを再構築し、レア信号プロセスのより良い選択を可能にする可能性を開く。
関連論文リスト
- Low Latency Transformer Inference on FPGAs for Physics Applications with hls4ml [2.6892725687961394]
本研究では, hls4ml を用いたフィールドプログラミング可能なゲートアレー (FPGA) におけるトランスフォーマアーキテクチャの効率的な実装を提案する。
VU13P FPGAチップへの展開は2us未満の達成であり、リアルタイムアプリケーションの可能性を示している。
論文 参考訳(メタデータ) (2024-09-08T19:50:25Z) - Investigating Resource-efficient Neutron/Gamma Classification ML Models Targeting eFPGAs [0.0]
オープンソース組み込みFPGA(eFPGA)フレームワークは、ハードウェアに機械学習モデルを実装するための、代替的で柔軟な経路を提供する。
完全連結ニューラルネットワーク(fcNN)と強化決定木(BDT)モデルのeFPGA実装のパラメータ空間について検討する。
この研究結果は、テストチップの一部として統合されるeFPGAファブリックの仕様策定を支援するために使用される。
論文 参考訳(メタデータ) (2024-04-19T20:03:30Z) - Understanding the Potential of FPGA-Based Spatial Acceleration for Large Language Model Inference [11.614722231006695]
数十億のパラメータを誇った大規模言語モデル(LLM)は、推論ワークロードの効率的なデプロイに対する大きな需要を生み出している。
本稿では,FPGA上でのLLM推論におけるモデル固有空間加速度の実現可能性と可能性について検討する。
論文 参考訳(メタデータ) (2023-12-23T04:27:06Z) - Reconfigurable Distributed FPGA Cluster Design for Deep Learning
Accelerators [59.11160990637615]
エッジコンピューティングアプリケーション用に設計された低消費電力組み込みFPGAに基づく分散システムを提案する。
提案システムは,様々なニューラルネットワーク(NN)モデルを同時に実行し,パイプライン構造にグラフを配置し,NNグラフの最も計算集約的な層により大きなリソースを手動で割り当てる。
論文 参考訳(メタデータ) (2023-05-24T16:08:55Z) - End-to-end codesign of Hessian-aware quantized neural networks for FPGAs
and ASICs [49.358119307844035]
我々は、共設計ニューラルネットワーク(NN)のトレーニングと実装のためのエンドツーエンドワークフローを開発する。
これにより、ハードウェアにおける効率的なNN実装が、非専門家に、単一のオープンソースワークフローでアクセスできるようになる。
大型ハドロン衝突型加速器(LHC)の40MHz衝突速度で動作しなければならないトリガー決定を含む粒子物理学アプリケーションにおけるワークフローを実演する。
シミュレーションLHC陽子-陽子衝突における高速粒子ジェット用混合精度NNを実装した。
論文 参考訳(メタデータ) (2023-04-13T18:00:01Z) - HARFLOW3D: A Latency-Oriented 3D-CNN Accelerator Toolflow for HAR on
FPGA Devices [71.45672882756001]
本研究では,3次元畳み込みニューラルネットワークをFPGAにマッピングするための,新しいストリーミングアーキテクチャベースのツールフローを提案する。
HARFLOW3Dツールフローは、ONNXフォーマットで3D CNNを入力し、FPGAの特性を記述する。
ツールフローが幅広いモデルやデバイスをサポートする能力は、様々な3D CNNとFPGAシステムペアに関する数多くの実験を通して示される。
論文 参考訳(メタデータ) (2023-03-30T08:25:27Z) - LL-GNN: Low Latency Graph Neural Networks on FPGAs for High Energy
Physics [45.666822327616046]
本研究は,粒子検出器のための低グラフニューラルネットワーク(LL-GNN)設計のための新しい再構成可能なアーキテクチャを提案する。
LL-GNNの設計は、洗練されたアルゴリズムが実験データを効率的に処理できるようにすることで、次世代のトリガーシステムを進化させる。
論文 参考訳(メタデータ) (2022-09-28T12:55:35Z) - VAQF: Fully Automatic Software-hardware Co-design Framework for Low-bit
Vision Transformer [121.85581713299918]
量子化ビジョントランス(ViT)のためのFPGAプラットフォーム上で推論アクセラレータを構築するフレームワークVAQFを提案する。
モデル構造と所望のフレームレートから、VAQFはアクティベーションに必要な量子化精度を自動的に出力する。
FPGA上でのViTアクセラレーションに量子化が組み込まれたのはこれが初めてである。
論文 参考訳(メタデータ) (2022-01-17T20:27:52Z) - Nanosecond machine learning event classification with boosted decision
trees in FPGA for high energy physics [0.0]
フィールドプログラマブルゲートアレイ(FPGA)における機械学習/人工知能手法であるブーストド決定木(Boosted decision tree, BDT)を用いた分類の新たな実装を提案する。
対象者は,高エネルギー物理実験や,リアルタイムイベント分類における最低遅延値の決定を必要とする者に対して,カスタム電子トリガーシステムのユーザである。
論文 参考訳(メタデータ) (2021-04-07T21:46:42Z) - EdgeBERT: Sentence-Level Energy Optimizations for Latency-Aware
Multi-Task NLP Inference [82.1584439276834]
BERTのようなトランスフォーマーベースの言語モデルでは、自然言語処理(NLP)タスクの精度が大幅に向上する。
We present EdgeBERT, a in-deepth algorithm- hardware co-design for latency-aware energy optimization for multi-task NLP。
論文 参考訳(メタデータ) (2020-11-28T19:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。