論文の概要: ColliderML: The First Release of an OpenDataDetector High-Luminosity Physics Benchmark Dataset
- arxiv url: http://arxiv.org/abs/2512.15230v1
- Date: Wed, 17 Dec 2025 09:30:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.919643
- Title: ColliderML: The First Release of an OpenDataDetector High-Luminosity Physics Benchmark Dataset
- Title(参考訳): ColliderML: OpenDataDetector High-Luminosity物理ベンチマークデータセットの最初のリリース
- Authors: Doğa Elitez, Paul Gessinger, Daniel Murnane, Marcus Selchou Raaholt, Andreas Salzburger, Stine Kofoed Skov, Andreas Stefl, Anna Zaborowska,
- Abstract要約: ColliderMLは、高速ハドロン衝突条件下での完全にシミュレートされ、デジタル化された陽子-陽子衝突のデータセットである。
10のStandard ModelおよびBeyond Standard Modelプロセスに100万のイベントと、広範な単一粒子サンプルを提供する。
このリリースは、MLフレンドリーなHugging Faceプラットフォームで提供される、検出器レベルのデータに関する機械学習(ML)研究の大きなギャップを埋めるものだ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce ColliderML - a large, open, experiment-agnostic dataset of fully simulated and digitised proton-proton collisions in High-Luminosity Large Hadron Collider conditions ($\sqrt{s}=14$ TeV, mean pile-up $μ= 200$). ColliderML provides one million events across ten Standard Model and Beyond Standard Model processes, plus extensive single-particle samples, all produced with modern next-to-leading order matrix element calculation and showering, realistic per-event pile-up overlay, a validated OpenDataDetector geometry, and standard reconstructions. The release fills a major gap for machine learning (ML) research on detector-level data, provided on the ML-friendly Hugging Face platform. We present physics coverage and the generation, simulation, digitisation and reconstruction pipeline, describe format and access, and initial collider physics benchmarks.
- Abstract(参考訳): 大型ハドロン衝突型加速器条件(=14$TeV、平均$μ=200$)において、完全にシミュレートされ、デジタル化された陽子-陽子衝突の大規模かつオープンな実験的なデータセットであるCollindMLを紹介した。
ColliderMLは、10のStandard ModelとBeyond Standard Modelプロセスに100万のイベントを提供するとともに、広範な単一粒子サンプルも提供しています。
このリリースは、MLフレンドリーなHugging Faceプラットフォームで提供される、検出器レベルのデータに関する機械学習(ML)研究の大きなギャップを埋めるものだ。
我々は、物理のカバレッジと生成、シミュレーション、デジタル化と再構築パイプライン、フォーマットとアクセス、および初期のコライダー物理ベンチマークについて述べる。
関連論文リスト
- DexVLG: Dexterous Vision-Language-Grasp Model at Scale [59.5613919093295]
ヒトのような器用な手のための大型モデルを用いた機能的握りの研究はほとんどない。
DexVLGは、言語命令に整合したDexterousグリップポーズ予測のための大型ビジョン言語-Graspモデルである。
シミュレーションでは、174,000個のオブジェクトのセマンティックな部分にマッピングされた1億1千万個のデキスタスなグリップポーズを、詳細な部分レベルのキャプションと組み合わせて生成する。
論文 参考訳(メタデータ) (2025-07-03T16:05:25Z) - Fine-tuning machine-learned particle-flow reconstruction for new detector geometries in future colliders [1.988691274281547]
本研究では,高エネルギー粒子衝突装置における粒子流再構成を訓練した機械学習アルゴリズムにおいて,伝達学習能力を実証する。
我々の知る限り、これは粒子-流れ再構成のための完全なクロス・ディテクター・トランスファー学習研究としては初めてのものである。
論文 参考訳(メタデータ) (2025-02-28T19:16:01Z) - DreamMask: Boosting Open-vocabulary Panoptic Segmentation with Synthetic Data [61.62554324594797]
オープンな語彙設定でトレーニングデータを生成する方法と、実データと合成データの両方でモデルをトレーニングする方法を探索するDreamMaskを提案する。
一般的に、DreamMaskは大規模なトレーニングデータの収集を著しく単純化し、既存のメソッドのプラグイン・アンド・プレイ・エンハンスメントとして機能する。
例えば、COCOで訓練しADE20Kで試験すると、ドリームマスクを装備したモデルは以前の最先端の2.1% mIoUよりも優れていた。
論文 参考訳(メタデータ) (2025-01-03T19:00:00Z) - Synthesizing Post-Training Data for LLMs through Multi-Agent Simulation [51.20656279478878]
MATRIXは、様々なテキストベースのシナリオを自動的に生成するマルチエージェントシミュレータである。
制御可能でリアルなデータ合成のためのMATRIX-Genを紹介する。
AlpacaEval 2 と Arena-Hard のベンチマークでは、Llama-3-8B-Base が、MATRIX-Gen によって合成されたデータセット上で、たった 20K の命令応答ペアで、Meta の Llama-3-8B-Instruct モデルより優れています。
論文 参考訳(メタデータ) (2024-10-18T08:01:39Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - Lamarr: LHCb ultra-fast simulation based on machine learning models deployed within Gauss [0.0]
LHCb実験における検出器応答と再構成アルゴリズムの両方をパラメータ化するシミュレーション生成を高速化するフレームワークであるLamarrについて論じる。
複数のアルゴリズムと戦略を駆使した深部生成モデルを用いて、LHCb検出器の単一成分の高レベル応答を効果的にパラメータ化する。
論文 参考訳(メタデータ) (2023-03-20T20:18:04Z) - The Dark Machines Anomaly Score Challenge: Benchmark Data and Model
Independent Event Classification for the Large Hadron Collider [0.0]
我々は、Dark Machines InitiativeとLes Houches 2019 Workshop on Physics at TeV Colllidersで実施されたデータチャレンジの結果について説明する。
この課題は、教師なし機械学習アルゴリズムを使用して、LHCで新しい物理学の信号を検出することを目的としている。
論文 参考訳(メタデータ) (2021-05-28T18:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。