論文の概要: A New Workflow for Materials Discovery Bridging the Gap Between Experimental Databases and Graph Neural Networks
- arxiv url: http://arxiv.org/abs/2602.00756v1
- Date: Sat, 31 Jan 2026 14:44:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.380832
- Title: A New Workflow for Materials Discovery Bridging the Gap Between Experimental Databases and Graph Neural Networks
- Title(参考訳): 実験データベースとグラフニューラルネットワークのギャップを埋める材料発見のための新しいワークフロー
- Authors: Brandon Schoener, Yuting Hu, Pasit Wanlapha, Akshay Rengarajan, Ian Moog, Michael Wang, Peihong Zhang, Jinjun Xiong, Hao Zeng,
- Abstract要約: 無機結晶構造データベース(ICSD)を用いた実験データベースと結晶情報ファイル(CIF)のアライメントプロセスを提案する。
本手法は,材料特性予測に最先端のモデルアーキテクチャを活用可能なデータベースの構築を可能にする。
平均絶対誤差 (MAE) とCCR (Correct Classification Rate) の両方において, 磁性材料の秩序温度と磁気接地状態の予測において有意な改善が認められた。
- 参考スコア(独自算出の注目度): 10.116093920635583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Incorporating Machine Learning (ML) into material property prediction has become a crucial step in accelerating materials discovery. A key challenge is the severe lack of training data, as many properties are too complicated to calculate with high-throughput first principles techniques. To address this, recent research has created experimental databases from information extracted from scientific literature. However, most existing experimental databases do not provide full atomic coordinate information, which prevents them from supporting advanced ML architectures such as Graph Neural Networks (GNNs). In this work, we propose to bridge this gap through an alignment process between experimental databases and Crystallographic Information Files (CIF) from the Inorganic Crystal Structure Database (ICSD). Our approach enables the creation of a database that can fully leverage state-of-the-art model architectures for material property prediction. It also opens the door to utilizing transfer learning to improve prediction accuracy. To validate our approach, we align NEMAD with the ICSD and compare models trained on the resulting database to those trained on NEMAD originally. We demonstrate significant improvements in both Mean Absolute Error (MAE) and Correct Classification Rate (CCR) in predicting the ordering temperatures and magnetic ground states of magnetic materials, respectively.
- Abstract(参考訳): 機械学習(ML)を材料特性予測に組み込むことは、材料発見を加速させる重要なステップとなっている。
重要な課題は、多くのプロパティが高スループットの第一原理のテクニックで計算するには複雑すぎるため、トレーニングデータの深刻な欠如である。
これを解決するために、最近の研究では、科学文献から抽出された情報から実験的なデータベースを作成している。
しかし、既存の実験データベースのほとんどは完全な原子座標情報を提供しておらず、グラフニューラルネットワーク(GNN)のような高度なMLアーキテクチャをサポートできない。
本研究では,無機結晶構造データベース(ICSD)から,実験データベースと結晶情報ファイル(CIF)のアライメントプロセスを通じて,このギャップを埋めることを提案する。
本手法は,材料特性予測に最先端のモデルアーキテクチャを活用可能なデータベースの構築を可能にする。
また、転送学習を利用して予測精度を向上させるための扉を開く。
提案手法を検証するため,NEMADをICSDと整列させ,結果データベースでトレーニングしたモデルとNEMADでトレーニングしたモデルとを比較した。
平均絶対誤差 (MAE) と正分類率 (CCR) は, 磁性材料の秩序温度と磁気接地状態を予測する上で, それぞれ有意な改善が認められた。
関連論文リスト
- A Roadmap for Applying Graph Neural Networks to Numerical Data: Insights from Cementitious Materials [5.565428903960444]
この研究は、コンクリートを設計するためのグラフニューラルネットワーク(GNN)モデルを実装するための最初の数少ない研究の1つである。
GNNはグラフとして構造化されたデータから学習し、不規則またはトポロジに依存した接続を通じて関係をキャプチャする。
提案するフレームワークは、将来のマルチモーダルおよび物理インフォームドGNNモデルの強力な基盤を確立する。
論文 参考訳(メタデータ) (2025-12-16T19:17:05Z) - Fusing CFD and measurement data using transfer learning [49.1574468325115]
本稿では,伝送学習によるシミュレーションと計測データを組み合わせたニューラルネットワークに基づく非線形手法を提案する。
最初のステップでは、ニューラルネットワークがシミュレーションデータに基づいてトレーニングされ、分散量の空間的特徴を学習する。
第2のステップは、ニューラルネットワークモデル全体の小さなサブセットを再トレーニングするだけで、シミュレーションと測定の間の体系的なエラーを修正するために、測定データ上での変換学習である。
論文 参考訳(メタデータ) (2025-07-28T07:21:46Z) - AMBER: Adaptive Mesh Generation by Iterative Mesh Resolution Prediction [48.72179728638418]
本稿では,メッシュ適応のための教師あり学習手法であるAMBER(Adaptive Meshing By Expert Reconstruction)を提案する。
AMBERは、サイズフィールドを反復的に予測し、この予測を使用して、アウト・オブ・ザ・ボックスメッシュジェネレータを使用して、新しい中間メッシュを生成する。
AMBERを2次元および3次元の幾何学、古典物理学問題を含むデータセット、機械部品、人間の専門家メッシュを用いた実世界の産業デザインで評価する。
論文 参考訳(メタデータ) (2025-05-29T17:10:44Z) - Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文 参考訳(メタデータ) (2025-03-18T02:14:49Z) - A Materials Map Integrating Experimental and Computational Data via Graph-Based Machine Learning for Enhanced Materials Discovery [5.06756291053173]
材料情報学(MI)は材料開発と発見を著しく加速すると予想されている。
MIで使用されるデータは、計算と実験の両方の研究から導かれる。
本研究では,材料特性と構造的特徴の関係を可視化する材料マップを構築するために得られたデータセットを用いた。
論文 参考訳(メタデータ) (2025-03-10T14:31:34Z) - Towards Data-Efficient Pretraining for Atomic Property Prediction [51.660835328611626]
タスク関連データセットでの事前トレーニングは、大規模な事前トレーニングと一致するか、あるいは超える可能性があることを示す。
本稿では,コンピュータビジョンのFr'echet Inception Distanceにインスパイアされた,化学類似度指数(CSI)を紹介する。
論文 参考訳(メタデータ) (2025-02-16T11:46:23Z) - RelGNN: Composite Message Passing for Relational Deep Learning [56.48834369525997]
RelGNNはリレーショナルデータベースから構築されたグラフのユニークな構造特性を活用するために特別に設計された新しいGNNフレームワークである。
RelGNNは、Relbench(Fey et al., 2024)から30の多様な実世界のタスクで評価され、ほとんどのタスクで最先端のパフォーマンスを実現し、最大25%の改善を実現している。
論文 参考訳(メタデータ) (2025-02-10T18:58:40Z) - Transfer Learning for Deep Learning-based Prediction of Lattice Thermal Conductivity [0.0]
深層学習モデル(ParAIsite)の精度と一般化性に及ぼす伝達学習の影響について検討する。
格子熱伝導率(LTC)の低品質近似の大規模なデータセット上で、初めて微調整を行うと、さらに改善が得られた。
有望な結果は、低熱伝導率材料を探索する大きなデータベースを探索する能力を高めるための道を開く。
論文 参考訳(メタデータ) (2024-11-27T11:57:58Z) - MaD-Scientist: AI-based Scientist solving Convection-Diffusion-Reaction Equations Using Massive PINN-Based Prior Data [22.262191225577244]
科学的基礎モデル(SFM)にも同様のアプローチが適用できるかどうかを考察する。
数学辞書の任意の線形結合によって構築された偏微分方程式(PDE)の解の形で、低コストな物理情報ニューラルネットワーク(PINN)に基づく近似された事前データを収集する。
本研究では,1次元対流拡散反応方程式に関する実験的な証拠を提供する。
論文 参考訳(メタデータ) (2024-10-09T00:52:00Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z) - Machine learning for metal additive manufacturing: Predicting
temperature and melt pool fluid dynamics using physics-informed neural
networks [0.0]
本稿では,データと最初の物理原理を融合する物理情報ニューラルネットワーク(PINN)フレームワークを提案する。
これは、PINNの3次元AMプロセスモデリングへの最初の応用である。
PINNは、金属AMプロセス中の温度とプールのダイナミクスをある程度のラベル付きデータセットで正確に予測することができる。
論文 参考訳(メタデータ) (2020-07-28T20:34:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。