論文の概要: Towards foundation-style models for energy-frontier heterogeneous neutrino detectors via self-supervised pre-training
- arxiv url: http://arxiv.org/abs/2604.07037v1
- Date: Wed, 08 Apr 2026 12:52:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.53646
- Title: Towards foundation-style models for energy-frontier heterogeneous neutrino detectors via self-supervised pre-training
- Title(参考訳): 自己教師型プレトレーニングによるエネルギーフロンティア不均一ニュートリノ検出器の基礎モデルに向けて
- Authors: Saúl Alonso-Monsalve, Fabio Cufino, Umut Kose, Anna Mascellani, André Rubbia,
- Abstract要約: 異種検出器データから再利用可能な表現を学習するための疎ViTフレームワークを提案する。
自己教師付き事前訓練は、マスク付き自己エンコーダ再構築とリレーショナルボクセルレベルの目的を組み合わせる。
プレトレーニングはニュートリノの風味とチャームクォークの識別を継続的に改善する。
- 参考スコア(独自算出の注目度): 0.4151704012621244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accelerator-based neutrino physics is entering an energy-frontier regime in which interactions reach the TeV scale and produce exceptionally dense, overlapping detector signatures. In this regime, event interpretation becomes impractical for conventional reconstruction approaches, particularly when labelled data are scarce and the analysis spans diverse downstream objectives. We present a sparse ViT framework for learning reusable representations from heterogeneous detector data. Self-supervised pre-training combines masked autoencoder reconstruction with relational voxel-level objectives for hierarchy, ghost and particle identification, and the resulting shared encoder is then jointly fine-tuned across classification and regression tasks. Evaluated on simulated events from the proposed FASERCal concept at the LHC, we find that pre-training consistently improves neutrino flavour and charm-quark identification, momentum regression, and vertex reconstruction over training from scratch, with the addition of relational objectives yielding further gains in the most topologically complex channels. Interpretability analyses further show that pre-training yields a more structured latent space, while detector-subsystem ablations recover physically plausible channel-dependent roles for the heterogeneous inputs. A data-efficiency study shows that, with roughly $10^3$ labelled events, the pre-trained encoder already matches the flavour-classification performance of a randomly initialised model trained on an order of magnitude more data. The learned representations also transfer effectively to publicly available benchmarks spanning different detector technologies and energy scales, matching or exceeding published baselines. These results support self-supervised pre-training on multimodal detector data as a scalable route towards reusable representations for neutrino and particle-detector analysis.
- Abstract(参考訳): 加速器に基づくニュートリノ物理学は、相互作用がTeVスケールに達し、非常に密度が高く重なり合う検出器シグネチャを生成するエネルギーフロンティア体制に入りつつある。
この体制では、特にラベル付きデータが不足し、その分析が下流の様々な目的にまたがる場合、イベント解釈は従来の再構築手法では実行不可能となる。
異種検出器データから再利用可能な表現を学習するための疎ViTフレームワークを提案する。
自己教師付き事前訓練は、マスク付き自己エンコーダ再構築と、階層、ゴースト、および粒子識別のための関係ボクセルレベルの目的を組み合わせ、結果として得られた共有エンコーダを、分類および回帰タスク間で協調的に微調整する。
LHCで提案されたFASERCalの概念からシミュレーションイベントを評価すると、事前学習は、最もトポロジカルに複雑なチャネルにおいて、関係目的の付加により、スクラッチからのトレーニングよりもニュートリノのフレーバーとチャームクォークの識別、モーメントレグレッションレグレッション、頂点再構成を一貫して改善することがわかった。
解釈可能性分析により、事前学習によりより構造化された潜伏空間が得られ、検出器サブシステムによるアブレーションが不均一な入力に対して物理的に妥当なチャネル依存的な役割を回復することが示された。
データ効率の研究によると、約10^3$のラベル付きイベントにおいて、事前学習されたエンコーダは、大まかに多くのデータに基づいて訓練されたランダムに初期化されたモデルの風味分類性能と既に一致している。
学習された表現は、異なる検出器技術とエネルギースケールにまたがる公開されているベンチマークに効果的に転送される。
これらの結果は、ニュートリノおよび粒子検出器分析のための再利用可能な表現へのスケーラブルな経路として、マルチモーダル検出器データによる自己教師付き事前学習をサポートする。
関連論文リスト
- Benchmarking neural surrogates on realistic spatiotemporal multiphysics flows [18.240532888032394]
我々は、困難でアプリケーション駆動のリアクティブフローでニューラルネットワークサロゲートをテストするために設計された厳格なベンチマークフレームワークであるREALM(Realistic AI Learning for Multiphysics)を提案する。
我々は、スペクトル演算子、畳み込みモデル、トランスフォーマー、ポイントワイド演算子、グラフ/メッシュネットワークを含む、12以上の代表代理モデルファミリをベンチマークする。
i)次元性、剛性、メッシュの不規則性によって共同で管理されるスケーリング障壁により、ロールアウトエラーが急速に増加すること、(ii)パラメータカウントよりもアーキテクチャ上の帰納バイアスによって主に制御されるパフォーマンス、(iii)精度の指標と物理的にの間にある永続的なギャップ、の3つの頑健な傾向を識別する。
論文 参考訳(メタデータ) (2025-12-21T05:04:13Z) - Quantum-Aware Generative AI for Materials Discovery: A Framework for Robust Exploration Beyond DFT Biases [0.0]
材料発見のための量子認識型生成AIフレームワークを提案する。
我々は、低忠実度予測と高忠実度予測の分岐を定量化し、ターゲットとする頑健な能動学習ループを実装した。
以上の結果から,高分散領域における潜在的安定候補の同定に成功し,3~5倍の精度向上が得られた。
論文 参考訳(メタデータ) (2025-12-13T11:17:21Z) - Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Latent Representation Learning in Heavy-Ion Collisions with MaskPoint Transformer [2.6610943214001765]
本稿では,トランスフォーマーベースのオートエンコーダについて,自己教師付き事前学習と教師付き微調整という2段階のパラダイムで学習した。
エンコーダはラベルのないHICデータから直接潜在表現を学習し、コンパクトで情報豊富な特徴空間を提供する。
その結果,HICにおける特徴学習の汎用的かつ堅牢な基盤として2段階の枠組みを確立し,クォークグルーオンプラズマ特性のより強力な解析への扉を開くことができた。
論文 参考訳(メタデータ) (2025-10-08T06:27:10Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - In-Context Linear Regression Demystified: Training Dynamics and Mechanistic Interpretability of Multi-Head Softmax Attention [52.159541540613915]
本研究では,マルチヘッド型ソフトマックスアテンションモデルを用いて,線形データを用いたコンテキスト内学習を行う方法について検討する。
この結果から,学習内容の学習能力は,そのアーキテクチャと基礎となるデータ分布の集約的効果として,訓練されたトランスフォーマーから出現することが明らかとなった。
論文 参考訳(メタデータ) (2025-03-17T02:00:49Z) - CycleHOI: Improving Human-Object Interaction Detection with Cycle Consistency of Detection and Generation [37.45945633515955]
本稿では,人間と物体の相互作用(HOI)の検出性能を高めるために,CycleHOIという新しい学習フレームワークを提案する。
我々の鍵となる設計は、HOI検出器のトレーニングのための新しいサイクル整合性損失を導入することである。
我々は,CycleHOIの有効性と一般化力を検証するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-07-16T06:55:43Z) - PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive
Learning [109.84770951839289]
歴史的文脈からビジュアルダイナミクスを学習するための新しいリカレントネットワークであるPredRNNを紹介する。
本手法は,3つの標準データセット上で高い競争結果が得られることを示す。
論文 参考訳(メタデータ) (2021-03-17T08:28:30Z) - Scalable, End-to-End, Deep-Learning-Based Data Reconstruction Chain for
Particle Imaging Detectors [0.0]
本稿では,Lyquid Time Projection Chambers (LArTPCs) のためのエンドツーエンドのMLベースのデータ再構成チェーンを提案する。
これは、何十もの高エネルギーニュートリノ相互作用の既往の積み重ねを扱う最初の実装である。
論文 参考訳(メタデータ) (2021-02-01T18:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。