論文の概要: Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures
- arxiv url: http://arxiv.org/abs/2508.07423v2
- Date: Fri, 15 Aug 2025 17:25:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 12:43:44.869384
- Title: Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures
- Title(参考訳): 不均一アーキテクチャを用いた機械学習による非構造データのリアルタイム解析
- Authors: Fotis I. Giasemis,
- Abstract要約: この論文は、機械学習モデルをそのような環境に効率的にデプロイする方法を理解するのに役立ちます。
CERNにおけるLHCb実験において,荷電粒子軌道再構成のためのグラフニューラルネットワークを用いたパイプラインを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the particle physics community needs higher and higher precisions in order to test our current model of the subatomic world, larger and larger datasets are necessary. With upgrades scheduled for the detectors of colliding-beam experiments around the world, and specifically at the Large Hadron Collider at CERN, more collisions and more complex interactions are expected. This directly implies an increase in data produced and consequently in the computational resources needed to process them. At CERN, the amount of data produced is gargantuan. This is why the data have to be heavily filtered and selected in real time before being permanently stored. This data can then be used to perform physics analyses, in order to expand our current understanding of the universe and improve the Standard Model of physics. This real-time filtering, known as triggering, involves complex processing happening often at frequencies as high as 40 MHz. This thesis contributes to understanding how machine learning models can be efficiently deployed in such environments, in order to maximize throughput and minimize energy consumption. Inevitably, modern hardware designed for such tasks and contemporary algorithms are needed in order to meet the challenges posed by the stringent, high-frequency data rates. In this work, I present our graph neural network-based pipeline, developed for charged particle track reconstruction at the LHCb experiment at CERN. The pipeline was implemented end-to-end inside LHCb's first-level trigger, entirely on GPUs. Its performance was compared against the classical tracking algorithms currently in production at LHCb. The pipeline was also accelerated on the FPGA architecture, and its performance in terms of power consumption and processing speed was compared against the GPU implementation.
- Abstract(参考訳): 粒子物理学のコミュニティは、我々の現在の原子下世界のモデルをテストするために、より高度な精度を必要とするため、より大規模なデータセットが必要である。
世界中の衝突ビーム実験検出器、特にCERNの大型ハドロン衝突型加速器では、さらなる衝突と複雑な相互作用が期待されている。
これは直接的に生成されたデータの増加を意味し、その結果、それらを処理するのに必要な計算資源が増加することを意味する。
CERNでは、生成されるデータの量はガーガントゥアンである。
これが、データが永続的に保存される前に、頻繁にフィルタされ、リアルタイムで選択される必要がある理由です。
このデータは、宇宙の現在の理解を拡大し、物理学の標準モデルを改善するために物理学分析を行うために使われる。
このリアルタイムフィルタリングはトリガーと呼ばれ、40MHzの周波数で発生する複雑な処理を含む。
この論文は、スループットを最大化し、エネルギー消費を最小化するために、機械学習モデルをそのような環境に効率的にデプロイする方法を理解するのに寄与する。
必然的に、このようなタスクや現代的なアルゴリズムのために設計された現代的なハードウェアは、厳密で高周波なデータレートによって生じる課題を満たすために必要である。
本研究では,CERNにおけるLHCb実験において,荷電粒子軌道再構成のためのグラフニューラルネットワークを用いたパイプラインを提案する。
パイプラインはLHCbの第1レベルのトリガ内で、完全にGPU上でエンドツーエンドに実装された。
その性能は、現在LHCbで生産されている古典的な追跡アルゴリズムと比較された。
FPGAアーキテクチャ上でもパイプラインが高速化され、GPU実装と比較して消費電力と処理速度の面での性能が比較された。
関連論文リスト
- Geometric GNNs for Charged Particle Tracking at GlueX [0.4241054493737716]
ジェファーソン研究所のGlueX実験から得られたデータを追跡するためのGNNモデルの評価を行った。
本稿では,複数のイベントをバッチで処理することで,GNNモデルによる大幅な高速化を実現することを示す。
論文 参考訳(メタデータ) (2025-05-28T15:52:22Z) - The Artificial Scientist -- in-transit Machine Learning of Plasma Simulations [32.40273928214554]
シミュレーションデータを機械学習(ML)フレームワークに直接ストリーミングするストリーミングワークフローを実演する。
提示されたワークフローでは、データ操作は共通で使いやすいプログラミング言語で実行できる。
論文 参考訳(メタデータ) (2025-01-06T20:58:27Z) - Fast Neural Network Inference on FPGAs for Triggering on Long-Lived
Particles at Colliders [0.0]
本研究では,中性長寿命粒子が検出器体積内で崩壊する事象を選択するための2つの機械学習アルゴリズムを提案する。
提案したアルゴリズムは, ベンチマークのシナリオにおいて有効であることが証明され, FPGAカード上での高速化では精度が劣化しないことが判明した。
論文 参考訳(メタデータ) (2023-07-11T10:17:57Z) - Simulation-Based Parallel Training [55.41644538483948]
このようなボトルネックを緩和するトレーニングフレームワークを設計するために、現在進行中の作業を紹介します。
トレーニングプロセスと並行してデータを生成する。
このバイアスをメモリバッファで軽減する戦略を提案する。
論文 参考訳(メタデータ) (2022-11-08T09:31:25Z) - PARTIME: Scalable and Parallel Processing Over Time with Deep Neural
Networks [68.96484488899901]
PartIMEは、データが継続的にストリーミングされるたびにニューラルネットワークを高速化するように設計されたライブラリです。
PartIMEは、ストリームから利用可能になった時点で、各データサンプルの処理を開始する。
オンライン学習において、PartialIMEと古典的な非並列ニューラル計算を経験的に比較するために実験が行われる。
論文 参考訳(メタデータ) (2022-10-17T14:49:14Z) - Where Is My Training Bottleneck? Hidden Trade-Offs in Deep Learning
Preprocessing Pipelines [77.45213180689952]
ディープラーニングにおける前処理パイプラインは、トレーニングプロセスを忙しくするための十分なデータスループットの提供を目的としている。
エンドツーエンドのディープラーニングパイプラインのためのデータセットを効率的に準備する新たな視点を導入する。
チューニングされていないシステムに比べてスループットが3倍から13倍に向上する。
論文 参考訳(メタデータ) (2022-02-17T14:31:58Z) - Towards Quantum Graph Neural Networks: An Ego-Graph Learning Approach [47.19265172105025]
グラフ構造化データのための新しいハイブリッド量子古典アルゴリズムを提案し、これをEgo-graph based Quantum Graph Neural Network (egoQGNN)と呼ぶ。
egoQGNNはテンソル積とユニティ行列表現を用いてGNN理論フレームワークを実装し、必要なモデルパラメータの数を大幅に削減する。
このアーキテクチャは、現実世界のデータからヒルベルト空間への新しいマッピングに基づいている。
論文 参考訳(メタデータ) (2022-01-13T16:35:45Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。