論文の概要: Scaling Particle Collision Data Analysis
- arxiv url: http://arxiv.org/abs/2412.00129v2
- Date: Tue, 10 Dec 2024 01:46:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-11 14:32:54.652745
- Title: Scaling Particle Collision Data Analysis
- Title(参考訳): 粒子衝突データ解析のスケーリング
- Authors: Hengkui Wu, Panpan Chi, Yongfeng Zhu, Liujiang Liu, Shuyang Hu, Yuexin Wang, Chen Zhou, Qihao Wang, Yingsi Xin, Bruce Liu, Dahao Liang, Xinglong Jia, Manqi Ruan,
- Abstract要約: 本稿では,テキストと大規模数値実験データの混合による事前学習を容易にするために,バイナリトークン化方式を用いたタスク非依存アーキテクチャBBT-Neutronを提案する。
高エネルギー物理学における重要な分類問題であるJet Origin Identification (JoI) へのBBT-Neutronの適用を実証する。
以上の結果から,BBT-Neutronはタスク固有のJoIモデルに匹敵する性能を示した。
- 参考スコア(独自算出の注目度): 0.5698619365543939
- License:
- Abstract: For decades, researchers have developed task-specific models to address scientific challenges across diverse disciplines. Recently, large language models (LLMs) have shown enormous capabilities in handling general tasks; however, these models encounter difficulties in addressing real-world scientific problems, particularly in domains involving large-scale numerical data analysis, such as experimental high energy physics. This limitation is primarily due to BPE tokenization's inefficacy with numerical data. In this paper, we propose a task-agnostic architecture, BBT-Neutron, which employs a binary tokenization method to facilitate pretraining on a mixture of textual and large-scale numerical experimental data. We demonstrate the application of BBT-Neutron to Jet Origin Identification (JoI), a critical categorization challenge in high-energy physics that distinguishes jets originating from various quarks or gluons. Our results indicate that BBT-Neutron achieves comparable performance to state-of-the-art task-specific JoI models. Furthermore, we examine the scaling behavior of BBT-Neutron's performance with increasing data volume, suggesting the potential for BBT-Neutron to serve as a foundational model for particle physics data analysis, with possible extensions to a broad spectrum of scientific computing applications for Big Science experiments, industrial manufacturing and spacial computing. The project code is available at https://github.com/supersymmetry-technologies/bbt-neutron.
- Abstract(参考訳): 何十年もの間、研究者は様々な分野にまたがる科学的課題に対処するタスク固有のモデルを開発してきた。
近年, 大規模言語モデル (LLM) は, 一般タスクの処理能力が非常に高いが, 実世界の科学的問題, 特に実験高エネルギー物理学などの大規模数値データ解析に関わる領域において, 対処に困難を経験している。
この制限は主に、数値データに対するBPEトークン化の非効率性に起因する。
本稿では,テキストと大規模数値実験データの混合による事前学習を容易にするために,バイナリトークン化方式を用いたタスク非依存アーキテクチャBBT-Neutronを提案する。
種々のクォークやグルーオンから発生するジェットを区別する高エネルギー物理学における重要な分類問題であるJet Origin Identification (JoI) へのBBT-Neutronの適用を実証する。
以上の結果から,BBT-Neutronはタスク固有のJoIモデルに匹敵する性能を示した。
さらに,BBT-Neutronのデータ量の増加に伴うBBT-Neutronの性能のスケーリング挙動について検討し,BBT-Neutronが粒子物理データ解析の基礎モデルとして機能しうる可能性を示唆した。
プロジェクトのコードはhttps://github.com/supersymmetric-technologies/bbt-neutronで公開されている。
関連論文リスト
- Pseudo-Physics-Informed Neural Operators: Enhancing Operator Learning from Limited Data [17.835190275166408]
PPI-NO(Pseudo Physics-Informed Neural Operator)フレームワークを提案する。
PPI-NOは、基本微分作用素から導かれる偏微分方程式(PDE)を用いて、対象系に対する代理物理系を構築する。
このフレームワークは,データ共有シナリオにおける標準演算子学習モデルの精度を大幅に向上させる。
論文 参考訳(メタデータ) (2025-02-04T19:50:06Z) - Mixture-of-Experts Graph Transformers for Interpretable Particle Collision Detection [36.56642608984189]
本稿では,グラフトランスフォーマーモデルとMixture-of-Expertレイヤを組み合わせることで,高い予測性能を実現する手法を提案する。
我々は、ATLAS実験からシミュレーションイベントのモデルを評価し、希少な超対称性信号イベントの識別に焦点をあてた。
このアプローチは、高エネルギー物理学に適用された機械学習手法における説明可能性の重要性を浮き彫りにする。
論文 参考訳(メタデータ) (2025-01-06T23:28:19Z) - End-to-end Phase Field Model Discovery Combining Experimentation,
Crowdsourcing, Simulation and Learning [9.763339269757227]
エンド・ツー・エンドのフェーズ・フィールド・モデル探索のためのフェーズ・フィールド・ラボ・プラットフォームを提案する。
Phase-Field-Labは、(i)アノテーション時間を短縮する合理化されたアノテーションツール、(ii)データからフェーズフィールドモデルを自動的に学習するエンドツーエンドのニューラルモデル、(iii)新しいインターフェースと視覚化を組み合わせる。
我々のプラットフォームは極端条件下での材料中のナノ構造進化の解析に利用されている。
論文 参考訳(メタデータ) (2023-09-13T22:44:04Z) - Machine learning enabled experimental design and parameter estimation
for ultrafast spin dynamics [54.172707311728885]
機械学習とベイズ最適実験設計(BOED)を組み合わせた方法論を提案する。
本手法は,大規模スピンダイナミクスシミュレーションのためのニューラルネットワークモデルを用いて,BOEDの正確な分布と実用計算を行う。
数値ベンチマークでは,XPFS実験の誘導,モデルパラメータの予測,実験時間内でのより情報的な測定を行う上で,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-03T06:19:20Z) - Applications of Gaussian Processes at Extreme Lengthscales: From
Molecules to Black Holes [4.18804572788063]
この論文は、ケイファート銀河のマカリアン335からの潜伏放出のサインを推論するためにGPモデリングを使用することを目的としている。
第2の貢献はGPフレームワークを分子および化学反応表現に拡張し、このフレームワークを科学者が使えるようにするためのオープンソースソフトウェアライブラリを提供することである。
第4の貢献は、アレタリック不確実性をモデル化し、本質的なロバスト性を有する材料成分の大規模製造プロセスへの同定を容易にするベイズ最適化スキームの導入である。
論文 参考訳(メタデータ) (2023-03-24T22:20:14Z) - Quantum computing for data analysis in high energy physics [1.6002009406818865]
本稿では,量子コンピューティングの高エネルギー物理学におけるデータ解析への応用について概説する。
本稿では、これらの新しい分析手法を日々の分析ワークフローに統合する際の課題と機会について論じる。
論文 参考訳(メタデータ) (2022-03-15T18:27:43Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Quantum-tailored machine-learning characterization of a superconducting
qubit [50.591267188664666]
我々は,量子デバイスのダイナミクスを特徴付ける手法を開発し,デバイスパラメータを学習する。
このアプローチは、数値的に生成された実験データに基づいてトレーニングされた物理に依存しないリカレントニューラルネットワークより優れている。
このデモンストレーションは、ドメイン知識を活用することで、この特徴付けタスクの正確性と効率が向上することを示す。
論文 参考訳(メタデータ) (2021-06-24T15:58:57Z) - Advanced Multi-Variate Analysis Methods for New Physics Searches at the
Large Hadron Collider [72.34476433304168]
ava4newphysicsは、高度多変量解析法と統計学習ツールの高エネルギー物理学問題へのカスタマイズと応用を研究した。
これらの手法の多くは、CERNにおけるATLASおよびCMS実験によるデータ解析の感度向上に成功している。
テスト段階にある他のいくつかは、基礎物理学パラメータの測定の精度と新しい現象の探索の到達範囲をさらに改善することを約束している。
論文 参考訳(メタデータ) (2021-05-16T22:20:30Z) - Bayesian Neural Networks for Fast SUSY Predictions [58.720142291102135]
本稿では,機械学習を用いて,BSM理論のパラメータ空間から予測へのマッピングをモデル化する。
3つの量はすべて平均パーセントの誤差3.34%以下でモデル化され、結果が導出される超対称性符号よりもはるかに短い時間でモデル化される。
結果は、機械学習がBSM理論の高次元空間から予測へのマッピングを正確にモデル化する可能性のさらなる実証である。
論文 参考訳(メタデータ) (2020-07-09T01:45:06Z) - Learning to Simulate Complex Physics with Graph Networks [68.43901833812448]
本稿では,機械学習のフレームワークとモデルの実装について紹介する。
グラフネットワーク・ベース・シミュレータ(GNS)と呼ばれる我々のフレームワークは、グラフ内のノードとして表現された粒子で物理系の状態を表現し、学習されたメッセージパスによって動的を計算します。
我々のモデルは,訓練中に数千の粒子による1段階の予測から,異なる初期条件,数千の時間ステップ,少なくとも1桁以上の粒子をテスト時に一般化できることを示す。
論文 参考訳(メタデータ) (2020-02-21T16:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。