論文の概要: MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling
- arxiv url: http://arxiv.org/abs/2309.05934v1
- Date: Tue, 12 Sep 2023 03:08:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 14:32:41.570604
- Title: MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling
- Title(参考訳): MatSciML: 固体材料モデリングのための多タスクベンチマーク
- Authors: Kin Long Kelvin Lee, Carmelo Gonzales, Marcel Nassar, Matthew
Spellings, Mikhail Galkin, Santiago Miret
- Abstract要約: MatSci MLは機械学習(MatSci ML)法を用いたMATerials SCIenceをモデル化するためのベンチマークである。
MatSci MLは、モデルトレーニングと評価のための多様な材料システムとプロパティデータを提供する。
マルチデータセットの学習環境において、MatchSci MLは、研究者が複数のデータセットからの観測を組み合わせ、共通の特性を共同で予測することを可能にする。
- 参考スコア(独自算出の注目度): 7.142619575624596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose MatSci ML, a novel benchmark for modeling MATerials SCIence using
Machine Learning (MatSci ML) methods focused on solid-state materials with
periodic crystal structures. Applying machine learning methods to solid-state
materials is a nascent field with substantial fragmentation largely driven by
the great variety of datasets used to develop machine learning models. This
fragmentation makes comparing the performance and generalizability of different
methods difficult, thereby hindering overall research progress in the field.
Building on top of open-source datasets, including large-scale datasets like
the OpenCatalyst, OQMD, NOMAD, the Carolina Materials Database, and Materials
Project, the MatSci ML benchmark provides a diverse set of materials systems
and properties data for model training and evaluation, including simulated
energies, atomic forces, material bandgaps, as well as classification data for
crystal symmetries via space groups. The diversity of properties in MatSci ML
makes the implementation and evaluation of multi-task learning algorithms for
solid-state materials possible, while the diversity of datasets facilitates the
development of new, more generalized algorithms and methods across multiple
datasets. In the multi-dataset learning setting, MatSci ML enables researchers
to combine observations from multiple datasets to perform joint prediction of
common properties, such as energy and forces. Using MatSci ML, we evaluate the
performance of different graph neural networks and equivariant point cloud
networks on several benchmark tasks spanning single task, multitask, and
multi-data learning scenarios. Our open-source code is available at
https://github.com/IntelLabs/matsciml.
- Abstract(参考訳): 本稿では,周期的結晶構造を有する固体材料に着目した機械学習(matsci ml)を用いた材料科学のモデリングベンチマークであるmatsci mlを提案する。
固相材料に機械学習手法を適用することは、機械学習モデルを開発するために使用される多種多様なデータセットによって大きく断片化され、生まれたばかりの分野である。
この断片化により、異なる手法の性能と一般化性の比較が困難になり、この分野における全体的な研究の進展を妨げる。
opencatalyst, oqmd, nomad, carolina materials database, and materials projectのような大規模なデータセットを含むオープンソースのデータセットの上に構築されたmatsci mlベンチマークは、シミュレーションエネルギー、原子力、物質バンドギャップ、および宇宙グループによる結晶対称性の分類データを含む、モデルトレーニングと評価のための多様な材料システムと特性データを提供する。
MatSci MLのプロパティの多様性は、固体材料に対するマルチタスク学習アルゴリズムの実装と評価を可能にし、データセットの多様性は、複数のデータセットにまたがる新しいより一般化されたアルゴリズムとメソッドの開発を促進する。
マルチデータセットの学習環境では、MatchSci MLは研究者が複数のデータセットからの観測を組み合わせることで、エネルギーや力などの共通特性を共同で予測することを可能にする。
matsci mlを用いて,単一タスク,マルチタスク,マルチデータ学習シナリオにまたがるベンチマークタスクにおいて,異なるグラフニューラルネットワークと等変点クラウドネットワークの性能を評価する。
当社のオープンソースコードはhttps://github.com/intellabs/matscimlで利用可能です。
関連論文リスト
- Multimodal Learning for Crystalline Materials [8.915142640507794]
液晶材料のための多モード学習(MLCM)は,多モードアライメントによる結晶材料の基礎モデルをトレーニングするための新しい手法である。
MLCMは、挑戦的なMaterial Projectデータベース上での材料特性予測のための最先端性能を実現する。
私たちの研究は、進行中のAI革命のイノベーションを材料科学の領域に持ち込み、素材を次世代AIのテストベッドとして特定します。
論文 参考訳(メタデータ) (2023-11-30T18:35:29Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Large Language Models as Master Key: Unlocking the Secrets of Materials
Science with GPT [9.33544942080883]
本稿では,物質科学におけるデバイスレベルでの情報抽出の複雑さに対処するため,構造化情報推論(SII)と呼ばれる自然言語処理(NLP)タスクを提案する。
我々は、既存のペロブスカイト型太陽電池FAIRデータセットに91.8%のF1スコアでGPT-3をチューニングし、リリース以来のデータでデータセットを拡張した。
また、太陽電池の電気性能を予測する実験を設計し、大規模言語モデル(LLM)を用いてターゲットパラメータを持つ材料や装置の設計を行った。
論文 参考訳(メタデータ) (2023-04-05T04:01:52Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Benchmarking Active Learning Strategies for Materials Optimization and
Discovery [17.8738267360992]
本稿では,様々な獲得関数の形で,アクティブな学習戦略をベンチマークするための参照データセットを提案する。
本稿では,アルゴリズムの性能,材料探索空間,複雑さ,事前知識の具体化との関係について論じる。
論文 参考訳(メタデータ) (2022-04-12T14:27:33Z) - PyHard: a novel tool for generating hardness embeddings to support
data-centric analysis [0.38233569758620045]
PyHardは、複数のMLモデルの予測パフォーマンスに関連するデータセットの硬度埋め込みを生成する。
ユーザは、この埋め込みを複数の方法で操作することで、データとアルゴリズムのパフォーマンスに関する有用な洞察を得ることができる。
我々は、この分析が、MLモデルに挑戦するハードな観察のポケットの識別をどのように支援したかを示す。
論文 参考訳(メタデータ) (2021-09-29T14:08:26Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - Intelligent multiscale simulation based on process-guided composite
database [0.0]
本稿では、プロセスモデリング、材料均質化、機械学習に基づく統合データ駆動モデリングフレームワークを提案する。
我々は, 自動車, 航空宇宙, エレクトロニクス産業において重要な材料システムとして認識されてきた, 射出成形した短繊維強化複合材料に興味を持っている。
論文 参考訳(メタデータ) (2020-03-20T20:39:19Z) - Multi-layer Optimizations for End-to-End Data Analytics [71.05611866288196]
代替アプローチを実現するフレームワークであるIFAQ(Iterative Functional Aggregate Queries)を紹介する。
IFAQは、特徴抽出クエリと学習タスクを、IFAQのドメイン固有言語で与えられた1つのプログラムとして扱う。
IFAQ の Scala 実装が mlpack,Scikit,特殊化を数桁で上回り,線形回帰木モデルや回帰木モデルを複数の関係データセット上で処理可能であることを示す。
論文 参考訳(メタデータ) (2020-01-10T16:14:44Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。