論文の概要: A computational theoretical approach for mining data on transient events
from databases of high energy astrophysics experiments
- arxiv url: http://arxiv.org/abs/2004.04131v1
- Date: Wed, 8 Apr 2020 17:34:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:21:24.006136
- Title: A computational theoretical approach for mining data on transient events
from databases of high energy astrophysics experiments
- Title(参考訳): 高エネルギー天体物理学実験データベースからの過渡事象のマイニングデータに対する計算論的アプローチ
- Authors: Francesco Lazzarotto, Marco Feroci, and Maria Teresa Pazienza
- Abstract要約: 本稿では,現代計算機科学の手法を高エネルギー天体物理学実験から得られた汎用大規模データベースに適用するための公式なモデルを提案する。
本手法は,予測情報を探索し,同定し,抽出することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data on transient events, like GRBs, are often contained in large databases
of unstructured data from space experiments, merged with potentially large
amount of background or simply undesired information. We present a
computational formal model to apply techniques of modern computer science -such
as Data Mining (DM) and Knowledge Discovering in Databases (KDD)- to a generic,
large database derived from a high energy astrophysics experiment. This method
is aimed to search, identify and extract expected information, and maybe to
discover unexpected information .
- Abstract(参考訳): GRBのような過渡事象に関するデータは、しばしば宇宙実験からの非構造化データの大規模なデータベースに格納され、潜在的に大量のバックグラウンドや単に望ましくない情報とマージされる。
本稿では,データマイニング (DM) や知識発見 (KDD) などの現代計算機科学の手法を,高エネルギー天体物理学実験から得られた汎用大規模データベースに適用するための計算形式モデルを提案する。
本手法は,予測情報を検索,識別,抽出することを目的としており,予期せぬ情報を発見することを目的としている。
関連論文リスト
- Towards a Theoretical Understanding of Memorization in Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(GenAI)の主流モデルとして採用されている。
モデル収束を前提とした条件付きおよび非条件付きDPMにおける記憶の理論的理解を提供する。
本研究では、生成されたデータに基づいて訓練された時間依存型分類器を代理条件として利用し、無条件DPMからトレーニングデータを抽出する、textbfSurrogate condItional Data extract (SIDE) という新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T13:17:06Z) - Big data searching using words [0.0]
データ検索における単語の近傍構造に関する基本的な考え方を紹介する。
また、ビッグデータ検索におけるビッグデータプライマリを導入し、データ検索における異常検出における近傍構造の適用について論じる。
論文 参考訳(メタデータ) (2024-09-10T13:46:14Z) - Scaling Law of Sim2Real Transfer Learning in Expanding Computational Materials Databases for Real-World Predictions [13.20562263181952]
計算データベース上で事前訓練された予測器を実システムに微調整すると、優れた一般化能力を持つモデルが得られる。
本研究では,物質科学における複数の機械学習タスクに対するシミュレーション・トゥ・リアル(Sim2Real)変換学習のスケーリング則を実証する。
論文 参考訳(メタデータ) (2024-08-07T18:47:58Z) - Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文 参考訳(メタデータ) (2024-08-01T21:38:09Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - GFlowNets for AI-Driven Scientific Discovery [74.27219800878304]
我々はGFlowNetsと呼ばれる新しい確率論的機械学習フレームワークを提案する。
GFlowNetsは、実験科学ループのモデリング、仮説生成、実験的な設計段階に適用できる。
我々は、GFlowNetsがAIによる科学的発見の貴重なツールになり得ると論じている。
論文 参考訳(メタデータ) (2023-02-01T17:29:43Z) - Data-Efficient Learning via Minimizing Hyperspherical Energy [48.47217827782576]
本稿では,少数の代表データを用いたスクラッチからのデータ効率学習の問題について考察する。
我々は,MHEに基づくアクティブラーニング(MHEAL)アルゴリズムを提案し,MHEALの包括的な理論的保証を提供する。
論文 参考訳(メタデータ) (2022-06-30T11:39:12Z) - Quantum computing for data analysis in high energy physics [1.6002009406818865]
本稿では,量子コンピューティングの高エネルギー物理学におけるデータ解析への応用について概説する。
本稿では、これらの新しい分析手法を日々の分析ワークフローに統合する際の課題と機会について論じる。
論文 参考訳(メタデータ) (2022-03-15T18:27:43Z) - A FAIR and AI-ready Higgs Boson Decay Dataset [15.325110053200305]
この記事では、与えられたデータセットがそれぞれのFAIR原則を満たすかどうかを評価するためのステップバイステップアセスメントガイドを提供する。
次に、CERN Large Hadron ColliderのCMS Collaborationによって生成されたオープン・シミュレートされたデータセットのFAIRnessを評価するために、このガイドを使用する方法を示す。
この研究は、高エネルギー粒子物理学データセットとAIモデルにおけるFAIRnessの作成と定量化に科学者を導くための一連の論文の中で、最初のものである。
論文 参考訳(メタデータ) (2021-08-04T18:00:03Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。