論文の概要: Scientific Machine Learning Benchmarks
- arxiv url: http://arxiv.org/abs/2110.12773v1
- Date: Mon, 25 Oct 2021 10:05:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 01:01:03.558909
- Title: Scientific Machine Learning Benchmarks
- Title(参考訳): 科学機械学習ベンチマーク
- Authors: Jeyan Thiyagalingam, Mallikarjun Shankar, Geoffrey Fox, Tony Hey
- Abstract要約: ディープラーニングニューラルネットワークのブレークスルーは、非常に大規模な実験データセットの分析にAIと機械学習技術の使用を変革した。
科学データセットの分析に最も適した機械学習アルゴリズムを特定することは、科学者にとって依然として課題である。
科学機械学習ベンチマークの開発における我々のアプローチを解説し、科学機械学習ベンチマークに対する他のアプローチについてレビューする。
- 参考スコア(独自算出の注目度): 0.17205106391379021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The breakthrough in Deep Learning neural networks has transformed the use of
AI and machine learning technologies for the analysis of very large
experimental datasets. These datasets are typically generated by large-scale
experimental facilities at national laboratories. In the context of science,
scientific machine learning focuses on training machines to identify patterns,
trends, and anomalies to extract meaningful scientific insights from such
datasets. With a new generation of experimental facilities, the rate of data
generation and the scale of data volumes will increasingly require the use of
more automated data analysis. At present, identifying the most appropriate
machine learning algorithm for the analysis of any given scientific dataset is
still a challenge for scientists. This is due to many different machine
learning frameworks, computer architectures, and machine learning models.
Historically, for modelling and simulation on HPC systems such problems have
been addressed through benchmarking computer applications, algorithms, and
architectures. Extending such a benchmarking approach and identifying metrics
for the application of machine learning methods to scientific datasets is a new
challenge for both scientists and computer scientists. In this paper, we
describe our approach to the development of scientific machine learning
benchmarks and review other approaches to benchmarking scientific machine
learning.
- Abstract(参考訳): ディープラーニングニューラルネットワークのブレークスルーは、非常に大規模な実験データセットの分析にAIと機械学習技術の使用を変革した。
これらのデータセットは通常、国立研究所の大規模実験施設によって生成される。
科学の文脈では、scientific machine learningは、そのようなデータセットから有意義な科学的洞察を抽出するパターン、トレンド、異常を特定するためのトレーニングマシンに焦点を当てている。
新しい世代の実験施設では、データ生成率とデータボリュームのスケールは、より自動化されたデータ分析の使用をますます必要とします。
現在、任意の科学データセットの分析に最適な機械学習アルゴリズムを特定することは、科学者にとって依然として課題である。
これは、多くの異なる機械学習フレームワーク、コンピュータアーキテクチャ、機械学習モデルに起因する。
歴史的に、HPCシステム上でのモデリングとシミュレーションは、コンピュータアプリケーション、アルゴリズム、アーキテクチャのベンチマークによって解決されてきた。
このようなベンチマークアプローチを拡張して、機械学習手法を科学的データセットに適用するためのメトリクスを特定することは、科学者と計算機科学者の両方にとって新たな課題である。
本稿では、科学的機械学習ベンチマークの開発に関する我々のアプローチと、科学的機械学習ベンチマークの他のアプローチについて概説する。
関連論文リスト
- Obtaining physical layer data of latest generation networks for investigating adversary attacks [0.0]
機械学習は、5Gや6Gといった最新世代のデータネットワークの機能の最適化に使用できる。
インテリジェント機械学習モデルの振る舞いを操作する敵対策が、大きな関心事になりつつある。
機械学習アプリケーションと連携して動作するシミュレーションモデルを提案する。
論文 参考訳(メタデータ) (2024-05-02T06:03:27Z) - EndToEndML: An Open-Source End-to-End Pipeline for Machine Learning Applications [0.2826977330147589]
機械学習モデルの事前処理、トレーニング、評価、可視化が可能なWebベースのエンドツーエンドパイプラインを提案する。
本ライブラリは,マルチモーダル・マルチセンサ・データセットの認識,分類,クラスタリング,および予測を支援する。
論文 参考訳(メタデータ) (2024-03-27T02:24:38Z) - Mechanistic Neural Networks for Scientific Machine Learning [58.99592521721158]
我々は、科学における機械学習応用のためのニューラルネットワーク設計であるメカニスティックニューラルネットワークを提案する。
新しいメカニスティックブロックを標準アーキテクチャに組み込んで、微分方程式を表現として明示的に学習する。
我々のアプローチの中心は、線形プログラムを解くために線形ODEを解く技術に着想を得た、新しい線形計画解法(NeuRLP)である。
論文 参考訳(メタデータ) (2024-02-20T15:23:24Z) - Interpretable Machine Learning for Discovery: Statistical Challenges \&
Opportunities [1.2891210250935146]
我々は、解釈可能な機械学習の分野について議論し、レビューする。
解釈可能な機械学習を用いて行うことができる発見の種類について概説する。
我々は、これらの発見をデータ駆動方式でどのように検証するかという大きな課題に焦点をあてる。
論文 参考訳(メタデータ) (2023-08-02T23:57:31Z) - Addressing computational challenges in physical system simulations with
machine learning [0.0]
シミュレーションを利用して様々な物理システムやプロセスを調べる研究者を支援する機械学習ベースのデータジェネレータフレームワークを提案する。
まず、シミュレーション結果を予測するために、限られたシミュレートされたデータセットを使用して教師付き予測モデルをトレーニングする。
その後、強化学習エージェントを訓練し、教師付きモデルを利用して正確なシミュレーションライクなデータを生成する。
論文 参考訳(メタデータ) (2023-05-16T17:31:50Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Learning from learning machines: a new generation of AI technology to
meet the needs of science [59.261050918992325]
科学的な発見のためのAIの有用性を高めるための新たな機会と課題を概説する。
産業におけるAIの目標と科学におけるAIの目標の区別は、データ内のパターンを識別することと、データから世界のパターンを発見することとの間に緊張を生じさせる。
論文 参考訳(メタデータ) (2021-11-27T00:55:21Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - Ten Quick Tips for Deep Learning in Biology [116.78436313026478]
機械学習は、データのパターンを認識し、予測モデリングに使用するアルゴリズムの開発と応用に関係している。
ディープラーニングは、独自の機械学習のサブフィールドになっている。
生物学的研究の文脈において、ディープラーニングは高次元の生物学的データから新しい洞察を導き出すためにますます使われてきた。
論文 参考訳(メタデータ) (2021-05-29T21:02:44Z) - Performance Analysis and Comparison of Machine and Deep Learning
Algorithms for IoT Data Classification [0.0]
本稿では,6つのIoT関連データセットを用いた分類タスクにおいて,11の一般的な機械学習アルゴリズムとディープラーニングアルゴリズムの性能評価を行う。
すべてのパフォーマンス指標を考慮すると、Random Forestsは他の機械学習モデルよりも優れており、ディープラーニングモデルのうち、ANNとCNNはより興味深い結果を得た。
論文 参考訳(メタデータ) (2020-01-27T09:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。