論文の概要: Towards an Interpretable Data-driven Trigger System for High-throughput
Physics Facilities
- arxiv url: http://arxiv.org/abs/2104.06622v1
- Date: Wed, 14 Apr 2021 05:01:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-15 13:28:08.492080
- Title: Towards an Interpretable Data-driven Trigger System for High-throughput
Physics Facilities
- Title(参考訳): 高スループット物理施設のためのデータ駆動トリガーシステムに向けて
- Authors: Chinmaya Mahesh, Kristin Dona, David W. Miller, Yuxin Chen
- Abstract要約: 高スループットデータフィルタリングとトリガシステムを設計するための新しいデータ駆動アプローチを紹介します。
私たちの目標は、どのデータイベントを維持するかを決定するために、最小限のランタイムコストでデータ駆動フィルタリングシステムを設計することです。
現在のパラダイムにおける非局所的非効率性を考慮するために、解釈可能な予測モデリングとコストに敏感な学習から重要な洞察を紹介します。
- 参考スコア(独自算出の注目度): 7.939382824995354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data-intensive science is increasingly reliant on real-time processing
capabilities and machine learning workflows, in order to filter and analyze the
extreme volumes of data being collected. This is especially true at the energy
and intensity frontiers of particle physics where bandwidths of raw data can
exceed 100 Tb/s of heterogeneous, high-dimensional data sourced from hundreds
of millions of individual sensors. In this paper, we introduce a new
data-driven approach for designing and optimizing high-throughput data
filtering and trigger systems such as those in use at physics facilities like
the Large Hadron Collider (LHC). Concretely, our goal is to design a
data-driven filtering system with a minimal run-time cost for determining which
data event to keep, while preserving (and potentially improving upon) the
distribution of the output as generated by the hand-designed trigger system. We
introduce key insights from interpretable predictive modeling and
cost-sensitive learning in order to account for non-local inefficiencies in the
current paradigm and construct a cost-effective data filtering and trigger
model that does not compromise physics coverage.
- Abstract(参考訳): データ集約型科学は、収集されるデータの極端な量をフィルタリングし分析するために、リアルタイム処理能力と機械学習ワークフローにますます依存している。
これは粒子物理学のエネルギーと強度のフロンティアにおいて特に当てはまり、原データの帯域幅は数億のセンサーから得られる100 Tb/sを超える。
本稿では,LHC(Large Hadron Collider)のような物理施設で使用される高スループットデータフィルタリングやトリガシステムの設計と最適化のための新しいデータ駆動方式を提案する。
具体的には、手書きトリガシステムによって生成された出力の分布を保存(そして潜在的に改善)しながら、どのデータイベントを保持するかを決定するための最小のランタイムコストでデータ駆動フィルタリングシステムを設計することである。
本研究では,現在のパラダイムにおける非局所的非効率を考慮した解釈可能な予測モデルとコスト依存学習から重要な知見を導入し,物理カバレッジを損なわないコスト効率の高いデータフィルタリングとトリガーモデルを構築した。
関連論文リスト
- Enhancing High-Energy Particle Physics Collision Analysis through Graph Data Attribution Techniques [0.0]
本稿では、シミュレーション粒子衝突データセットを用いて、グラフ分類パイプライン内の影響分析を統合する。
グラフニューラルネットワークを初等訓練に用いることにより,学習サンプルの同定に勾配に基づくデータ影響法を適用した。
破棄された要素を分析することで、イベント分類タスクに関するさらなる洞察を得ることができる。
論文 参考訳(メタデータ) (2024-07-20T12:40:03Z) - Computationally and Memory-Efficient Robust Predictive Analytics Using Big Data [0.0]
本研究では、データ不確実性、ストレージ制限、ビッグデータを用いた予測データ駆動モデリングの課題をナビゲートする。
本稿では,ロバスト主成分分析(RPCA)を有効ノイズ低減と外乱除去に利用し,最適センサ配置(OSP)を効率的なデータ圧縮・記憶に活用する。
論文 参考訳(メタデータ) (2024-03-27T22:39:08Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - A spectrum of physics-informed Gaussian processes for regression in
engineering [0.0]
センサとデータ全般の可用性は向上していますが、純粋なデータ駆動アプローチから多くのサービス内エンジニアリングシステムや構造を完全に特徴づけることはできません。
本稿では、限られたデータで予測モデルを作成する能力を高めるために、機械学習技術と物理に基づく推論の組み合わせを追求する。
論文 参考訳(メタデータ) (2023-09-19T14:39:03Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Online Data Selection for Federated Learning with Limited Storage [53.46789303416799]
ネットワークデバイス間での分散機械学習を実現するために、フェデレートラーニング(FL)が提案されている。
デバイス上のストレージがFLの性能に与える影響はまだ調査されていない。
本研究では,デバイス上のストレージを限定したFLのオンラインデータ選択について検討する。
論文 参考訳(メタデータ) (2022-09-01T03:27:33Z) - How Much More Data Do I Need? Estimating Requirements for Downstream
Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か?
データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。
本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文 参考訳(メタデータ) (2022-07-04T21:16:05Z) - Innovations in trigger and data acquisition systems for next-generation
physics facilities [0.6445605125467573]
データ集約型物理施設は、多種多様な大規模データ処理システムに依存している。
このホワイトペーパーは、これらの施設が引き金やデータ取得機器やシステムの設計において直面する課題を強調することを目的としている。
論文 参考訳(メタデータ) (2022-03-15T03:13:32Z) - Deep Reinforcement Learning Assisted Federated Learning Algorithm for
Data Management of IIoT [82.33080550378068]
産業用IoT(Industrial Internet of Things)の継続的な拡大により、IIoT機器は毎回大量のユーザデータを生成する。
IIoTの分野で、これらの時系列データを効率的かつ安全な方法で管理する方法は、依然として未解決の問題である。
本稿では,無線ネットワーク環境におけるIIoT機器データ管理におけるFL技術の適用について検討する。
論文 参考訳(メタデータ) (2022-02-03T07:12:36Z) - PREPRINT: Comparison of deep learning and hand crafted features for
mining simulation data [7.214140640112874]
本稿では,高次元データセットから有意な結果を自動抽出する作業について述べる。
このようなデータを処理することができる深層学習手法を提案し、シミュレーションデータに関する関連するタスクを解決するように訓練することができる。
16,000フローフィールドを含む翼まわりの流れ場の2次元シミュレーションの大規模なデータセットをコンパイルし,比較を行った。
論文 参考訳(メタデータ) (2021-03-11T09:28:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。