論文の概要: Introduction to the Usage of Open Data from the Large Hadron Collider for Computer Scientists in the Context of Machine Learning
- arxiv url: http://arxiv.org/abs/2501.06896v1
- Date: Sun, 12 Jan 2025 18:19:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:20:31.685642
- Title: Introduction to the Usage of Open Data from the Large Hadron Collider for Computer Scientists in the Context of Machine Learning
- Title(参考訳): 機械学習における大規模ハドロン衝突型加速器のオープンデータ活用入門
- Authors: Timo Saala, Matthias Schott,
- Abstract要約: 我々は、Large Hadron ColliderからPandas DataFramesにオープンデータを変換します。
本稿では,計算機科学者と物理学者の今後の学際協力の出発点となることを目的とする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Deep learning techniques have evolved rapidly in recent years, significantly impacting various scientific fields, including experimental particle physics. To effectively leverage the latest developments in computer science for particle physics, a strengthened collaboration between computer scientists and physicists is essential. As all machine learning techniques depend on the availability and comprehensibility of extensive data, clear data descriptions and commonly used data formats are prerequisites for successful collaboration. In this study, we converted open data from the Large Hadron Collider, recorded in the ROOT data format commonly used in high-energy physics, to pandas DataFrames, a well-known format in computer science. Additionally, we provide a brief introduction to the data's content and interpretation. This paper aims to serve as a starting point for future interdisciplinary collaborations between computer scientists and physicists, fostering closer ties and facilitating efficient knowledge exchange.
- Abstract(参考訳): 近年、深層学習技術は急速に発展し、実験粒子物理学を含む様々な科学分野に大きな影響を与えた。
コンピュータ科学の最近の進歩を粒子物理学に効果的に活用するためには、計算機科学者と物理学者の協力が不可欠である。
すべての機械学習技術は、広範囲なデータの可用性と理解度に依存しているため、明確なデータ記述と一般的に使用されるデータフォーマットは、コラボレーションを成功させるために必要不可欠である。
本研究では,高エネルギー物理でよく用いられるROOTデータフォーマットに記録されている大型ハドロン衝突型加速器のオープンデータを,コンピュータ科学でよく知られたフォーマットであるパンダス・データフレームに変換する。
さらに、データの内容と解釈を簡潔に紹介する。
本稿では,計算機科学者と物理学者の今後の学際的なコラボレーションの出発点として,より緊密な関係を育み,効率的な知識交換を促進することを目的としている。
関連論文リスト
- Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文 参考訳(メタデータ) (2024-08-01T21:38:09Z) - The Future of Data Science Education [0.11566458078238004]
バージニア大学のデータサイエンススクールは、データサイエンスの定義のための新しいモデルを開発した。
本稿では、モデルの中核となる特徴を説明し、AIの分析コンポーネントを超えて、さまざまな概念を統合する方法について説明する。
論文 参考訳(メタデータ) (2024-07-16T15:11:54Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - Approach to Data Science with Multiscale Information Theory [0.0]
データサイエンスは、大規模で複雑なデータセットから貴重な洞察を抽出する上で重要な役割を果たす、多分野の分野である。
データサイエンスの世界では、情報理論(IT)と統計力学(SM)の2つの基本的な要素がある。
本稿では,このデータサイエンスの枠組みを粒子からなる大規模かつ複雑な機械システムに適用する。
論文 参考訳(メタデータ) (2023-05-23T01:08:50Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - A Computational Inflection for Scientific Discovery [48.176406062568674]
我々は科学的な発見の軌跡において、かなりの屈折の足元に立っている。
社会が急速に成長するデジタルトランスフォーメーションを継続するにつれて、人類の集団的な科学的知識も同様である。
コンピュータ科学は科学プロセス自体に革命を起こそうとしている。
論文 参考訳(メタデータ) (2022-05-04T11:36:54Z) - Shared Data and Algorithms for Deep Learning in Fundamental Physics [4.914920952758052]
我々は、素粒子物理学、天体物理学、ハドロン物理学、核物理学を含む基礎物理学研究のデータセットの収集を紹介する。
これらのデータセットは、トップクォーク、宇宙線による大気シャワー、ハドロン物質の相転移、およびジェネレータレベルの履歴を含む。
我々は、広範囲の教師付き学習タスクに容易に適用可能な、単純で柔軟なグラフベースのニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-01T18:00:00Z) - Computational Skills by Stealth in Secondary School Data Science [16.960800464621993]
本稿では,学生によるデータサイエンスへの最初の露出における計算スキルのステルス開発について論じる。
このアプローチの目的は、データ駆動学習者になる際に、興味やコーディングの自己効力によらず、学生を支援することである。
論文 参考訳(メタデータ) (2020-10-08T09:11:51Z) - A Data Scientist's Guide to Streamflow Prediction [55.22219308265945]
我々は,水文降雨要素と流出モデルに着目し,洪水の予測と流れの予測に応用する。
このガイドは、データサイエンティストが問題や水文学的な概念、そしてその過程で現れる詳細を理解するのを助けることを目的としています。
論文 参考訳(メタデータ) (2020-06-05T08:04:37Z) - How do Data Science Workers Collaborate? Roles, Workflows, and Tools [30.725728321928823]
データサイエンスの様々な側面で働く183人の参加者を対象にオンライン調査を行った。
データサイエンスチームは極めて協力的であり、さまざまな利害関係者やツールと連携しています。
論文 参考訳(メタデータ) (2020-01-18T15:11:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。