論文の概要: M$^2$Hub: Unlocking the Potential of Machine Learning for Materials
Discovery
- arxiv url: http://arxiv.org/abs/2307.05378v1
- Date: Wed, 14 Jun 2023 23:06:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-16 03:43:09.537545
- Title: M$^2$Hub: Unlocking the Potential of Machine Learning for Materials
Discovery
- Title(参考訳): m$^2$hub: 材料発見のための機械学習の可能性を解き放つ
- Authors: Yuanqi Du, Yingheng Wang, Yining Huang, Jianan Canal Li, Yanqiao Zhu,
Tian Xie, Chenru Duan, John M. Gregoire, Carla P. Gomes
- Abstract要約: 材料発見において機械学習を前進させるツールキットであるM$2$Hubを紹介する。
M$2$Hubは、材料発見タスク、データセット、機械学習メソッド、評価、ベンチマーク結果への容易にアクセスできるようにする。
- 参考スコア(独自算出の注目度): 26.099381363351668
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce M$^2$Hub, a toolkit for advancing machine learning in materials
discovery. Machine learning has achieved remarkable progress in modeling
molecular structures, especially biomolecules for drug discovery. However, the
development of machine learning approaches for modeling materials structures
lag behind, which is partly due to the lack of an integrated platform that
enables access to diverse tasks for materials discovery. To bridge this gap,
M$^2$Hub will enable easy access to materials discovery tasks, datasets,
machine learning methods, evaluations, and benchmark results that cover the
entire workflow. Specifically, the first release of M$^2$Hub focuses on three
key stages in materials discovery: virtual screening, inverse design, and
molecular simulation, including 9 datasets that covers 6 types of materials
with 56 tasks across 8 types of material properties. We further provide 2
synthetic datasets for the purpose of generative tasks on materials. In
addition to random data splits, we also provide 3 additional data partitions to
reflect the real-world materials discovery scenarios. State-of-the-art machine
learning methods (including those are suitable for materials structures but
never compared in the literature) are benchmarked on representative tasks. Our
codes and library are publicly available at https://github.com/yuanqidu/M2Hub.
- Abstract(参考訳): 材料発見における機械学習を促進するツールキットであるM$^2$Hubを紹介する。
機械学習は分子構造、特に創薬のための生体分子のモデリングにおいて著しく進歩した。
しかし、材料構造のモデリングのための機械学習手法の開発は遅れており、材料発見のための多様なタスクへのアクセスを可能にする統合プラットフォームが欠如していることにも理由がある。
このギャップを埋めるため、M$^2$Hubは、ワークフロー全体をカバーする材料発見タスク、データセット、機械学習メソッド、評価、ベンチマーク結果へのアクセスを簡単にする。
具体的には、M$^2$Hubの最初のリリースでは、仮想スクリーニング、逆設計、分子シミュレーションの3つの重要な段階に焦点を当てている。
さらに,材料生成タスクのための2つの合成データセットを提供する。
ランダムなデータ分割に加えて、現実世界の物質発見シナリオを反映した3つのデータパーティションも提供します。
最先端の機械学習手法(材料構造に適しているが文献では比較されないものを含む)は、代表的タスクでベンチマークされる。
私たちのコードとライブラリはhttps://github.com/yuanqidu/m2hubで公開されています。
関連論文リスト
- Foundation Model for Composite Materials and Microstructural Analysis [49.1574468325115]
複合材料に特化して設計された基礎モデルを提案する。
我々のモデルは、頑健な潜伏特性を学習するために、短繊維コンポジットのデータセット上で事前訓練されている。
転送学習中、MMAEはR2スコアが0.959に達し、限られたデータで訓練しても0.91を超えている均質化剛性を正確に予測する。
論文 参考訳(メタデータ) (2024-11-10T19:06:25Z) - MatExpert: Decomposing Materials Discovery by Mimicking Human Experts [26.364419690908992]
MatExpertは、大規模言語モデルと対照的な学習を活用して、新しい固体材料の発見と設計を加速する新しいフレームワークである。
人間の素材設計専門家のワークフローにインスパイアされた我々のアプローチは、検索、遷移、生成という3つの重要な段階を統合している。
MatExpertは、ランガウジュに基づく生成モデルを用いた計算材料発見の有意義な進歩を表している。
論文 参考訳(メタデータ) (2024-10-26T00:44:54Z) - Any-point Trajectory Modeling for Policy Learning [64.23861308947852]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Agent-based Learning of Materials Datasets from Scientific Literature [0.0]
我々は,大規模言語モデル(LLM)を利用した化学AIエージェントを開発し,自然言語テキストから構造化データセットを作成する。
化学者のAIエージェントであるEunomiaは、何十年もの科学研究論文から既存の知識を活用して、行動を計画し実行することができる。
論文 参考訳(メタデータ) (2023-12-18T20:29:58Z) - Multimodal Learning for Materials [7.167520424757711]
材料の基礎モデルの自己教師型マルチモーダルトレーニングを可能にするマルチモーダル・ラーニング・フォー・マテリアル(MultiMat)を紹介した。
複数の軸上のMaterial Projectデータベースからのデータを用いてフレームワークの可能性を示す。
論文 参考訳(メタデータ) (2023-11-30T18:35:29Z) - MatSciML: A Broad, Multi-Task Benchmark for Solid-State Materials
Modeling [7.142619575624596]
MatSci MLは機械学習(MatSci ML)法を用いたMATerials SCIenceをモデル化するためのベンチマークである。
MatSci MLは、モデルトレーニングと評価のための多様な材料システムとプロパティデータを提供する。
マルチデータセットの学習環境において、MatchSci MLは、研究者が複数のデータセットからの観測を組み合わせ、共通の特性を共同で予測することを可能にする。
論文 参考訳(メタデータ) (2023-09-12T03:08:37Z) - The Open MatSci ML Toolkit: A Flexible Framework for Machine Learning in
Materials Science [3.577720074630756]
Open MatSci ML Toolkitは、科学的データにディープラーニングモデルとメソッドを適用するための、柔軟で自己完結型でスケーラブルなPythonベースのフレームワークである。
オープンソースリリースを通じて、このツールキットを研究コミュニティに公開し、共有することで、次のように期待しています。
OpenCatalystデータセットを使い始めようとする、新しい機械学習研究者や実践者の参入障壁を低くする。
論文 参考訳(メタデータ) (2022-10-31T17:11:36Z) - Kubric: A scalable dataset generator [73.78485189435729]
KubricはPythonフレームワークで、PyBulletやBlenderとインターフェースして写真リアリスティックなシーンを生成する。
本研究では,3次元NeRFモデルの研究から光フロー推定まで,13種類の異なるデータセットを提示することで,Kubricの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-07T18:13:59Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z) - Synthetic Data: Opening the data floodgates to enable faster, more
directed development of machine learning methods [96.92041573661407]
機械学習における画期的な進歩の多くは、大量のリッチデータを利用できることに起因する。
多くの大規模データセットは、医療データなど高度に敏感であり、機械学習コミュニティでは広く利用できない。
プライバシー保証で合成データを生成することは、そのようなソリューションを提供します。
論文 参考訳(メタデータ) (2020-12-08T17:26:10Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。