論文の概要: A cloud platform for automating and sharing analysis of raw simulation
data from high throughput polymer molecular dynamics simulations
- arxiv url: http://arxiv.org/abs/2208.01692v1
- Date: Tue, 2 Aug 2022 18:40:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 13:13:59.397514
- Title: A cloud platform for automating and sharing analysis of raw simulation
data from high throughput polymer molecular dynamics simulations
- Title(参考訳): 高スループット高分子分子動力学シミュレーションによる生シミュレーションデータの自動化と共有のためのクラウドプラットフォーム
- Authors: Tian Xie, Ha-Kyung Kwon, Daniel Schweigert, Sheng Gong, Arthur
France-Lanord, Arash Khajeh, Emily Crabb, Michael Puzon, Chris Fajardo, Will
Powelson, Yang Shao-Horn, and Jeffrey C. Grossman
- Abstract要約: 生データの共有を容易にするクラウドベースのプラットフォームについて説明する。
最初の実証として, アモルファス高分子電解質の6286分子動力学軌道を含む。
我々は、このプラットフォームが生データを新しい方法で共有し、計算材料科学コミュニティに新しい洞察を与えることを期待している。
- 参考スコア(独自算出の注目度): 1.1713998235451093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open material databases storing hundreds of thousands of material structures
and their corresponding properties have become the cornerstone of modern
computational materials science. Yet, the raw outputs of the simulations, such
as the trajectories from molecular dynamics simulations and charge densities
from density functional theory calculations, are generally not shared due to
their huge size. In this work, we describe a cloud-based platform to facilitate
the sharing of raw data and enable the fast post-processing in the cloud to
extract new properties defined by the user. As an initial demonstration, our
database currently includes 6286 molecular dynamics trajectories for amorphous
polymer electrolytes and 5.7 terabytes of data. We create a public analysis
library at https://github.com/TRI-AMDD/htp_md to extract multiple properties
from the raw data, using both expert designed functions and machine learning
models. The analysis is run automatically with computation in the cloud, and
results then populate a database that can be accessed publicly. Our platform
encourages users to contribute both new trajectory data and analysis functions
via public interfaces. Newly analyzed properties will be incorporated into the
database. Finally, we create a front-end user interface at
https://www.htpmd.matr.io for browsing and visualization of our data. We
envision the platform to be a new way of sharing raw data and new insights for
the computational materials science community.
- Abstract(参考訳): 数十万の材料構造とその特性を保存するオープンマテリアルデータベースは、現代の計算材料科学の基盤となっている。
しかし、分子動力学シミュレーションの軌道や密度汎関数理論の計算による電荷密度といったシミュレーションの生の出力は、その巨大さのため一般に共有されていない。
本研究では、生データの共有を容易にし、クラウド内の高速な後処理により、ユーザが定義した新しいプロパティを抽出できるクラウドベースのプラットフォームについて述べる。
最初のデモンストレーションとして、現在、アモルファスポリマー電解質の6286分子動力学軌道と5.7テラバイトのデータを含む。
我々はhttps://github.com/TRI-AMDD/htp_mdで公開分析ライブラリを作成し、専門家が設計した関数と機械学習モデルの両方を用いて生データから複数のプロパティを抽出する。
分析はクラウド上の計算で自動的に実行され、その結果、公開アクセス可能なデータベースが投入される。
我々のプラットフォームは,ユーザに対して,公開インターフェースを通じて新たなトラジェクティブデータと分析機能の両方をコントリビュートすることを奨励している。
新しい分析されたプロパティがデータベースに組み込まれる。
最後に、データのブラウジングと可視化のためのフロントエンドユーザーインターフェイスをhttps://www.htpmd.matr.ioで作成します。
我々は、このプラットフォームが生データを新しい方法で共有し、計算材料科学コミュニティに新しい洞察を与えることを期待している。
関連論文リスト
- Extrapolative ML Models for Copolymers [1.901715290314837]
機械学習モデルは、材料特性の予測に徐々に使われてきた。
これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。
本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文 参考訳(メタデータ) (2024-09-15T11:02:01Z) - Data Augmentations in Deep Weight Spaces [89.45272760013928]
そこで本研究では,Mixup法に基づく新しい拡張手法を提案する。
既存のベンチマークと新しいベンチマークでこれらのテクニックのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-11-15T10:43:13Z) - Tackling Computational Heterogeneity in FL: A Few Theoretical Insights [68.8204255655161]
我々は、計算異種データの形式化と処理を可能にする新しい集約フレームワークを導入し、分析する。
提案するアグリゲーションアルゴリズムは理論的および実験的予測から広範囲に解析される。
論文 参考訳(メタデータ) (2023-07-12T16:28:21Z) - Synthetic data enable experiments in atomistic machine learning [0.0]
既存のMLポテンシャルモデルから,原子単位のエネルギーをラベル付けした大規模データセットの使用を実演する。
このプロセスの安価さは、量子力学の土台真実に比べれば、数百万のデータポイントを生成できる。
合成データラベルの学習は、後続の小さなデータセットの微調整に有用な事前学習タスクであることを示す。
論文 参考訳(メタデータ) (2022-11-29T18:17:24Z) - Heterogenous Ensemble of Models for Molecular Property Prediction [55.91865861896012]
分子の異なるモーダル性を考える手法を提案する。
これらのモデルをHuberRegressorでアンサンブルします。
これにより、OGB Large-Scale Challenge (2022)の2textsuperscriptndエディションの勝利のソリューションが得られる。
論文 参考訳(メタデータ) (2022-11-20T17:25:26Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - SUPA: A Lightweight Diagnostic Simulator for Machine Learning in
Particle Physics [0.0]
SUPAは, 簡易な粒子伝搬, 散乱, シャワー発生をシミュレーションしてデータを生成するアルゴリズムおよびソフトウェアパッケージである。
提案したシミュレータは、デスクトップマシン上で毎秒数千の粒子シャワーを発生し、Geant4の最大6桁の速度を発生させる。
論文 参考訳(メタデータ) (2022-02-10T13:14:12Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Text Classification Using Hybrid Machine Learning Algorithms on Big Data [0.0]
本研究では,2つの教師付き機械学習アルゴリズムとテキストマイニング技術を組み合わせてハイブリッドモデルを生成する。
その結果、ハイブリッドモデルはそれぞれ61.45%と69.21%のNa"ive BayesとSVMモデルに対して96.76%の精度を示した。
論文 参考訳(メタデータ) (2021-03-30T19:02:48Z) - ACRONYM: A Large-Scale Grasp Dataset Based on Simulation [64.37675024289857]
ACRONYMは物理シミュレーションに基づくロボットグリップ計画のためのデータセットである。
データセットには17.7Mのパラレルジャウグリップが含まれ、262の異なるカテゴリから8872のオブジェクトにまたがっている。
我々は、この大規模で多様なデータセットの価値を、2つの最先端の学習に基づく把握計画アルゴリズムの訓練に利用することで示す。
論文 参考訳(メタデータ) (2020-11-18T23:24:00Z) - MatScIE: An automated tool for the generation of databases of methods
and parameters used in the computational materials science literature [5.217605474243695]
MatScIEは、材料科学文献から関連情報を抽出し、構造化されたデータベースを作成する。
ユーザーは公開された記事をアップロードし、このツールから取得した情報を閲覧/ダウンロードすることができる。
論文 参考訳(メタデータ) (2020-09-15T01:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。