論文の概要: MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling
- arxiv url: http://arxiv.org/abs/2309.05934v1
- Date: Tue, 12 Sep 2023 03:08:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 14:32:41.570604
- Title: MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling
- Title(参考訳): MatSciML: 固体材料モデリングのための多タスクベンチマーク
- Authors: Kin Long Kelvin Lee, Carmelo Gonzales, Marcel Nassar, Matthew
Spellings, Mikhail Galkin, Santiago Miret
- Abstract要約: MatSci MLは機械学習(MatSci ML)法を用いたMATerials SCIenceをモデル化するためのベンチマークである。
MatSci MLは、モデルトレーニングと評価のための多様な材料システムとプロパティデータを提供する。
マルチデータセットの学習環境において、MatchSci MLは、研究者が複数のデータセットからの観測を組み合わせ、共通の特性を共同で予測することを可能にする。
- 参考スコア(独自算出の注目度): 7.142619575624596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose MatSci ML, a novel benchmark for modeling MATerials SCIence using
Machine Learning (MatSci ML) methods focused on solid-state materials with
periodic crystal structures. Applying machine learning methods to solid-state
materials is a nascent field with substantial fragmentation largely driven by
the great variety of datasets used to develop machine learning models. This
fragmentation makes comparing the performance and generalizability of different
methods difficult, thereby hindering overall research progress in the field.
Building on top of open-source datasets, including large-scale datasets like
the OpenCatalyst, OQMD, NOMAD, the Carolina Materials Database, and Materials
Project, the MatSci ML benchmark provides a diverse set of materials systems
and properties data for model training and evaluation, including simulated
energies, atomic forces, material bandgaps, as well as classification data for
crystal symmetries via space groups. The diversity of properties in MatSci ML
makes the implementation and evaluation of multi-task learning algorithms for
solid-state materials possible, while the diversity of datasets facilitates the
development of new, more generalized algorithms and methods across multiple
datasets. In the multi-dataset learning setting, MatSci ML enables researchers
to combine observations from multiple datasets to perform joint prediction of
common properties, such as energy and forces. Using MatSci ML, we evaluate the
performance of different graph neural networks and equivariant point cloud
networks on several benchmark tasks spanning single task, multitask, and
multi-data learning scenarios. Our open-source code is available at
https://github.com/IntelLabs/matsciml.
- Abstract(参考訳): 本稿では,周期的結晶構造を有する固体材料に着目した機械学習(matsci ml)を用いた材料科学のモデリングベンチマークであるmatsci mlを提案する。
固相材料に機械学習手法を適用することは、機械学習モデルを開発するために使用される多種多様なデータセットによって大きく断片化され、生まれたばかりの分野である。
この断片化により、異なる手法の性能と一般化性の比較が困難になり、この分野における全体的な研究の進展を妨げる。
opencatalyst, oqmd, nomad, carolina materials database, and materials projectのような大規模なデータセットを含むオープンソースのデータセットの上に構築されたmatsci mlベンチマークは、シミュレーションエネルギー、原子力、物質バンドギャップ、および宇宙グループによる結晶対称性の分類データを含む、モデルトレーニングと評価のための多様な材料システムと特性データを提供する。
MatSci MLのプロパティの多様性は、固体材料に対するマルチタスク学習アルゴリズムの実装と評価を可能にし、データセットの多様性は、複数のデータセットにまたがる新しいより一般化されたアルゴリズムとメソッドの開発を促進する。
マルチデータセットの学習環境では、MatchSci MLは研究者が複数のデータセットからの観測を組み合わせることで、エネルギーや力などの共通特性を共同で予測することを可能にする。
matsci mlを用いて,単一タスク,マルチタスク,マルチデータ学習シナリオにまたがるベンチマークタスクにおいて,異なるグラフニューラルネットワークと等変点クラウドネットワークの性能を評価する。
当社のオープンソースコードはhttps://github.com/intellabs/matscimlで利用可能です。
関連論文リスト
- Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - MAmmoTH-VL: Eliciting Multimodal Reasoning with Instruction Tuning at Scale [66.73529246309033]
MLLM(Multimodal large language model)は、多モーダルタスクにおいて大きな可能性を秘めている。
既存の命令チューニングデータセットは、中間的合理性のないフレーズレベルの答えのみを提供する。
そこで本研究では,大規模マルチモーダル・インストラクション・チューニング・データセットを構築するためのスケーラブルで費用対効果の高い手法を提案する。
論文 参考訳(メタデータ) (2024-12-06T18:14:24Z) - Assessing data-driven predictions of band gap and electrical conductivity for transparent conducting materials [10.3054383984768]
本稿では,新しい透明導電材料発見の促進を目的としたデータ駆動型フレームワークを提案する。
利用可能なデータの不足を軽減するため、ユニークな実験データベースを作成し、検証する。
我々は、既知のTCMの典型的な要素を含む55の合成の一覧において、本手法を検証した。
論文 参考訳(メタデータ) (2024-11-21T11:37:05Z) - Towards a Classification of Open-Source ML Models and Datasets for Software Engineering [52.257764273141184]
オープンソースの事前訓練モデル(PTM)とデータセットは、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
我々は、人気のあるオープンソースのMLリポジトリであるHugging Face (HF)上で、SE指向の分類をPTMとデータセットに適用し、時間とともにPTMの進化を分析する。
論文 参考訳(メタデータ) (2024-11-14T18:52:05Z) - Multi-Task Multi-Fidelity Learning of Properties for Energetic Materials [34.8008617873679]
マルチタスクニューラルネットワークは、マルチモーダルデータから学習でき、特定の特性のために訓練されたシングルタスクモデルより優れている。
予想通り、データスカースプロパティでは改善がより重要になります。
このアプローチは、エネルギー材料以外の分野にも広く適用できる。
論文 参考訳(メタデータ) (2024-08-21T12:54:26Z) - Img-Diff: Contrastive Data Synthesis for Multimodal Large Language Models [49.439311430360284]
コントラスト学習と画像差分キャプションにインスパイアされた新しいデータ合成手法を提案する。
私たちのキーとなるアイデアは、マッチングと異なる要素の両方を識別するためにモデルに挑戦することです。
我々は、この生成されたデータセットを利用して、最先端(SOTA)MLLMを微調整する。
論文 参考訳(メタデータ) (2024-08-08T17:10:16Z) - Multimodal Learning for Materials [7.167520424757711]
材料の基礎モデルの自己教師型マルチモーダルトレーニングを可能にするマルチモーダル・ラーニング・フォー・マテリアル(MultiMat)を紹介した。
複数の軸上のMaterial Projectデータベースからのデータを用いてフレームワークの可能性を示す。
論文 参考訳(メタデータ) (2023-11-30T18:35:29Z) - MLLM-DataEngine: An Iterative Refinement Approach for MLLM [62.30753425449056]
本稿では,データ生成,モデルトレーニング,評価を橋渡しする新しいクローズドループシステムを提案する。
各ループ内で、MLLM-DataEngineはまず評価結果に基づいてモデルの弱点を分析する。
ターゲットとして,異なる種類のデータの比率を調整する適応型バッドケースサンプリングモジュールを提案する。
品質については、GPT-4を用いて、各データタイプで高品質なデータを生成する。
論文 参考訳(メタデータ) (2023-08-25T01:41:04Z) - PyHard: a novel tool for generating hardness embeddings to support
data-centric analysis [0.38233569758620045]
PyHardは、複数のMLモデルの予測パフォーマンスに関連するデータセットの硬度埋め込みを生成する。
ユーザは、この埋め込みを複数の方法で操作することで、データとアルゴリズムのパフォーマンスに関する有用な洞察を得ることができる。
我々は、この分析が、MLモデルに挑戦するハードな観察のポケットの識別をどのように支援したかを示す。
論文 参考訳(メタデータ) (2021-09-29T14:08:26Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - Intelligent multiscale simulation based on process-guided composite
database [0.0]
本稿では、プロセスモデリング、材料均質化、機械学習に基づく統合データ駆動モデリングフレームワークを提案する。
我々は, 自動車, 航空宇宙, エレクトロニクス産業において重要な材料システムとして認識されてきた, 射出成形した短繊維強化複合材料に興味を持っている。
論文 参考訳(メタデータ) (2020-03-20T20:39:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。