論文の概要: Fine-tuning machine-learned particle-flow reconstruction for new detector geometries in future colliders
- arxiv url: http://arxiv.org/abs/2503.00131v2
- Date: Mon, 24 Mar 2025 17:21:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:28:20.249810
- Title: Fine-tuning machine-learned particle-flow reconstruction for new detector geometries in future colliders
- Title(参考訳): 未来の衝突機における新しい検出器ジオメトリーのための微調整マシン学習粒子フロー再構成
- Authors: Farouk Mokhtar, Joosep Pata, Dolores Garcia, Eric Wulff, Mengke Zhang, Michael Kagan, Javier Duarte,
- Abstract要約: 本研究では,高エネルギー粒子衝突装置における粒子流再構成を訓練した機械学習アルゴリズムにおいて,伝達学習能力を実証する。
我々の知る限り、これは粒子-流れ再構成のための完全なクロス・ディテクター・トランスファー学習研究としては初めてのものである。
- 参考スコア(独自算出の注目度): 1.988691274281547
- License:
- Abstract: We demonstrate transfer learning capabilities in a machine-learned algorithm trained for particle-flow reconstruction in high energy particle colliders. This paper presents a cross-detector fine-tuning study, where we initially pre-train the model on a large full simulation dataset from one detector design, and subsequently fine-tune the model on a sample with a different collider and detector design. Specifically, we use the Compact Linear Collider detector (CLICdet) model for the initial training set, and demonstrate successful knowledge transfer to the CLIC-like detector (CLD) proposed for the Future Circular Collider in electron-positron mode (FCC-ee). We show that with an order of magnitude less samples from the second dataset, we can achieve the same performance as a costly training from scratch, across particle-level and event-level performance metrics, including jet and missing transverse momentum resolution. Furthermore, we find that the fine-tuned model achieves comparable performance to the traditional rule-based particle-flow approach on event-level metrics after training on 100,000 CLD events, whereas a model trained from scratch requires at least 1 million CLD events to achieve similar reconstruction performance. To our knowledge, this represents the first full-simulation cross-detector transfer learning study for particle-flow reconstruction. These findings offer valuable insights towards building large foundation models that can be fine-tuned across different detector designs and geometries, helping to accelerate the development cycle for new detectors and opening the door to rapid detector design and optimization using machine learning.
- Abstract(参考訳): 本研究では,高エネルギー粒子衝突装置における粒子流再構成を訓練した機械学習アルゴリズムにおいて,伝達学習能力を実証する。
本稿では,まず1つの検出器設計から大規模なシミュレーションデータセット上でモデルを事前学習し,その後,異なるコライダーと検出器設計でサンプル上でモデルを微調整する。
具体的には、最初のトレーニングセットとして、コンパクトリニア衝突型検出器(Clicdet)モデルを使用し、電子ポジトロンモード(FCC-ee)におけるFuture Circular Colliderのために提案されたCLD(CLIC-like detector)への知識伝達に成功したことを実証する。
2番目のデータセットからのサンプルを桁違いに減らせば、ジェットや横運動量分解能の欠如を含む粒子レベルおよびイベントレベルのパフォーマンス測定値において、スクラッチからコストのかかるトレーニングと同じパフォーマンスを達成できることを示す。
さらに,100,000のCLDイベントをトレーニングした後に,従来のルールベース粒子フロー手法と同等の性能が得られるのに対して,スクラッチからトレーニングしたモデルでは,100万以上のCLDイベントが必要であり,同様の再現性能を実現することができる。
我々の知る限り、これは粒子-流れ再構成のためのクロス検出器間移動学習研究としては初めてのものである。
これらの発見は、さまざまな検出器設計とジオメトリーを微調整できる大規模な基盤モデルを構築するための貴重な洞察を与え、新しい検出器の開発サイクルを加速し、機械学習を用いて迅速な検出器設計と最適化への扉を開くのに役立つ。
関連論文リスト
- Is Tokenization Needed for Masked Particle Modelling? [8.79008927474707]
Masked Particle Modeling (MPM) は、無順序集合の表現表現を構築するための自己教師付き学習スキームである。
実装における非効率に対処し、より強力なデコーダを組み込むことにより、MPMを改善する。
これらの新しい手法は、ジェットの基礎モデルのための新しいテストベッドにおいて、オリジナルのMPMからのトークン化学習目標よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-09-19T09:12:29Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - OmniJet-$α$: The first cross-task foundation model for particle physics [0.0]
ファンデーションモデルはマルチデータセットとマルチタスクの機械学習手法で、一度トレーニングされたら、様々なダウンストリームアプリケーションのために微調整できる。
我々は,この課題について,いくつかの点で大きな進展を報告している。
我々は、教師なし問題(ジェット世代)と教師なしタスク(ジェットタグ付け)の移行学習を、新しいOmniJet-$alpha$モデルで実証する。
論文 参考訳(メタデータ) (2024-03-08T19:00:01Z) - Deep Generative Models for Ultra-High Granularity Particle Physics Detector Simulation: A Voyage From Emulation to Extrapolation [0.0]
この論文は、ベルIIの実験でPixel Vertex Detector (PXD)のこの課題を克服することを目的としている。
本研究は、粒子物理学における超高粒度検出器シミュレーションに深部生成モデルを用いた結果について初めて紹介する。
論文 参考訳(メタデータ) (2024-03-05T23:12:47Z) - Masked Particle Modeling on Sets: Towards Self-Supervised High Energy Physics Foundation Models [4.299997052226609]
Masked Particle Modeling (MPM) は、無秩序な入力集合上の汎用的、転送可能、再利用可能な表現を学習するための自己教師付き手法である。
本研究では,コライダー物理実験における高エネルギージェットの試料中の方法の有効性について検討した。
論文 参考訳(メタデータ) (2024-01-24T15:46:32Z) - Improved particle-flow event reconstruction with scalable neural networks for current and future particle detectors [1.4609888393206634]
電子-陽電子衝突における事象再構成のためのスケーラブルな機械学習モデルについて, フル検出器シミュレーションに基づく検討を行った。
グラフニューラルネットワークとカーネルベースのトランスフォーマーを比較し、現実的な再構築を実現しつつ、操作を回避できることを実証する。
最良のグラフニューラルネットワークモデルでは、ルールベースのアルゴリズムと比較して、ジェット横運動量分解能が最大50%向上している。
論文 参考訳(メタデータ) (2023-09-13T08:16:15Z) - Interpretable Joint Event-Particle Reconstruction for Neutrino Physics
at NOvA with Sparse CNNs and Transformers [124.29621071934693]
本稿では,畳み込みによって実現される空間学習と,注意によって実現される文脈学習を組み合わせた新しいニューラルネットワークアーキテクチャを提案する。
TransformerCVNは各事象を同時に分類し、各粒子のアイデンティティを再構築する。
このアーキテクチャにより、ネットワークの予測に関する洞察を提供する、いくつかの解釈可能性の研究を行うことができる。
論文 参考訳(メタデータ) (2023-03-10T20:36:23Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Benchmarking Detection Transfer Learning with Vision Transformers [60.97703494764904]
オブジェクト検出メソッドの複雑さは、ViT(Vision Transformer)モデルのような新しいアーキテクチャが到着するときに、ベンチマークを非簡単にする。
本研究では,これらの課題を克服し,標準的なVTモデルをMask R-CNNのバックボーンとして活用する訓練手法を提案する。
その結果,最近のマスキングに基づく教師なし学習手法は,COCOにおける説得力のあるトランスファー学習改善をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2021-11-22T18:59:15Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。