論文の概要: The Open MatSci ML Toolkit: A Flexible Framework for Machine Learning in
Materials Science
- arxiv url: http://arxiv.org/abs/2210.17484v1
- Date: Mon, 31 Oct 2022 17:11:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 16:23:22.686255
- Title: The Open MatSci ML Toolkit: A Flexible Framework for Machine Learning in
Materials Science
- Title(参考訳): Open MatSci ML Toolkit: 材料科学における機械学習のための柔軟なフレームワーク
- Authors: Santiago Miret, Kin Long Kelvin Lee, Carmelo Gonzales, Marcel Nassar,
Matthew Spellings
- Abstract要約: Open MatSci ML Toolkitは、科学的データにディープラーニングモデルとメソッドを適用するための、柔軟で自己完結型でスケーラブルなPythonベースのフレームワークである。
オープンソースリリースを通じて、このツールキットを研究コミュニティに公開し、共有することで、次のように期待しています。
OpenCatalystデータセットを使い始めようとする、新しい機械学習研究者や実践者の参入障壁を低くする。
- 参考スコア(独自算出の注目度): 3.577720074630756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Open MatSci ML Toolkit: a flexible, self-contained, and
scalable Python-based framework to apply deep learning models and methods on
scientific data with a specific focus on materials science and the OpenCatalyst
Dataset. Our toolkit provides: 1. A scalable machine learning workflow for
materials science leveraging PyTorch Lightning, which enables seamless scaling
across different computation capabilities (laptop, server, cluster) and
hardware platforms (CPU, GPU, XPU). 2. Deep Graph Library (DGL) support for
rapid graph neural network prototyping and development. By publishing and
sharing this toolkit with the research community via open-source release, we
hope to: 1. Lower the entry barrier for new machine learning researchers and
practitioners that want to get started with the OpenCatalyst dataset, which
presently comprises the largest computational materials science dataset. 2.
Enable the scientific community to apply advanced machine learning tools to
high-impact scientific challenges, such as modeling of materials behavior for
clean energy applications. We demonstrate the capabilities of our framework by
enabling three new equivariant neural network models for multiple OpenCatalyst
tasks and arrive at promising results for compute scaling and model
performance.
- Abstract(参考訳): 物質科学とOpenCatalyst Datasetに特化して、ディープラーニングモデルと手法を科学データに適用するための、柔軟で自己完結型でスケーラブルなPythonベースのフレームワークであるOpen MatSci ML Toolkitを提示する。
私たちのツールキットは
PyTorch Lightningを利用することで、さまざまな計算機能(ラップトップ、サーバ、クラスタ)とハードウェアプラットフォーム(CPU、GPU、XPU)をシームレスにスケーリングできる。
2. 高速グラフニューラルネットワークのプロトタイピングと開発のためのディープグラフライブラリ(dgl)のサポート
このツールキットをオープンソースリリースを通じて研究コミュニティと公開し、共有することで、私たちは以下のことを望んでいます。
1. OpenCatalystデータセットを使い始めようとする新しい機械学習研究者や実践者の参入障壁を低くする。
2. クリーンエネルギー利用のための材料挙動のモデリング等、高度な機械学習ツールを科学的課題に適用することを可能とする。
複数のopencatalystタスクのための3つの新しい等価ニューラルネットワークモデルを可能にし、スケーリングとモデルパフォーマンスの計算に有望な結果に到達し、このフレームワークの能力を実証する。
関連論文リスト
- OS-ATLAS: A Foundation Action Model for Generalist GUI Agents [55.37173845836839]
OS-AtlasはGUIグラウンディングとOODエージェントタスクに優れた基礎的なGUIアクションモデルである。
現在までに1300万以上のGUI要素を含む、オープンソースのクロスプラットフォームGUI基盤コーパスをリリースしています。
論文 参考訳(メタデータ) (2024-10-30T17:10:19Z) - Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models [3.865029260331255]
本稿では,Open Materials 2024 (OMat24) の大規模オープンデータセットのMeta FAIRリリースについて述べる。
OMat24は、構造的および構成的多様性に焦点を当てた1億1000万以上の密度汎関数理論(DFT)計算を含んでいる。
私たちのEquiformerV2モデルは、Matbench Discoveryのリーダーボード上で最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-16T17:48:34Z) - OpenR: An Open Source Framework for Advanced Reasoning with Large Language Models [61.14336781917986]
大規模言語モデル(LLM)の推論能力を高めるためのオープンソースのフレームワークであるOpenRを紹介する。
OpenRは、データ取得、強化学習トレーニング、非自己回帰デコーディングを凝集性ソフトウェアプラットフォームに統合する。
私たちの研究は、OpenAIのo1モデルのコア技術と強化学習を探求する、オープンソースのフレームワークを初めて提供するものです。
論文 参考訳(メタデータ) (2024-10-12T23:42:16Z) - Deep Fast Machine Learning Utils: A Python Library for Streamlined Machine Learning Prototyping [0.0]
Deep Fast Machine Learning Utils (DFMLU)ライブラリは、機械学習プロセスのアスペクトを自動化および拡張するために設計されたツールを提供する。
DFMLUはモデル開発とデータ処理をサポートする機能を提供します。
この原稿はDFMLUの機能の概要を示し、各ツールにPythonの例を提供している。
論文 参考訳(メタデータ) (2024-09-14T21:39:17Z) - NNsight and NDIF: Democratizing Access to Foundation Model Internals [48.27939917017487]
NNsightはオープンソースのPythonパッケージで、グラフを構築することで任意のPyTorchモデルの介入を表現できるシンプルなフレキシブルなAPIを備えている。
NDIFは、NNsight APIを通じて基礎的なLLMへのアクセスを提供する共同研究プラットフォームである。
論文 参考訳(メタデータ) (2024-07-18T17:59:01Z) - VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models [89.63342806812413]
PyTorchに基づく大規模マルチモーダリティモデルを評価するためのオープンソースツールキットを提案する。
VLMEvalKitは70以上の大規模なマルチモダリティモデルを実装しており、プロプライエタリなAPIとオープンソースモデルの両方を含んでいる。
マルチモーダル学習研究の進展を追跡するために,OpenVLM Leaderboardを主催する。
論文 参考訳(メタデータ) (2024-07-16T13:06:15Z) - M$^2$Hub: Unlocking the Potential of Machine Learning for Materials
Discovery [26.099381363351668]
材料発見において機械学習を前進させるツールキットであるM$2$Hubを紹介する。
M$2$Hubは、材料発見タスク、データセット、機械学習メソッド、評価、ベンチマーク結果への容易にアクセスできるようにする。
論文 参考訳(メタデータ) (2023-06-14T23:06:36Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Flashlight: Enabling Innovation in Tools for Machine Learning [50.63188263773778]
私たちは、機械学習ツールやシステムの革新を促進するために構築されたオープンソースのライブラリであるFlashlightを紹介します。
Flashlightは、広く使われているライブラリを下流で活用し、機械学習とシステム研究者をより緊密に連携させる研究を可能にするツールだと考えています。
論文 参考訳(メタデータ) (2022-01-29T01:03:29Z) - On the impact of selected modern deep-learning techniques to the
performance and celerity of classification models in an experimental
high-energy physics use case [0.0]
ディープラーニング技術は、高エネルギー物理学の領域で遭遇する分類問題の文脈でテストされる。
利点は、パフォーマンスメトリクスと、結果のモデルのトレーニングと適用に必要な時間の両方の観点から評価されます。
LUMINと呼ばれるPyTorch用の新しいラッパーライブラリが紹介されている。
論文 参考訳(メタデータ) (2020-02-03T12:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。