論文の概要: Materials Map Integrating Experimental and Computational Data through Graph-Based Machine Learning for Enhanced Materials Discovery
- arxiv url: http://arxiv.org/abs/2503.07378v2
- Date: Tue, 11 Mar 2025 06:31:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 13:59:51.785059
- Title: Materials Map Integrating Experimental and Computational Data through Graph-Based Machine Learning for Enhanced Materials Discovery
- Title(参考訳): グラフベース機械学習による実験データと計算データの統合による材料探索
- Authors: Yusuke Hashimoto, Xue Jia, Hao Li, Takaaki Tomai,
- Abstract要約: 材料情報学(MI)は、材料発見と開発を大幅に効率化することが期待されている。
MIに使用されるデータは、計算と実験の両方から得られる。
本研究では,得られたデータを用いて材料マップを構築し,材料の構造的特徴との関係を可視化する。
- 参考スコア(独自算出の注目度): 5.06756291053173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Materials informatics (MI), which emerges from the integration of materials science and data science, is expected to greatly streamline the material discovery and development. The data used for MI are obtained from both computational and experimental studies, while their integration remains challenging. In our previous study, we reported the integration of these datasets by applying a machine learning model that captures trends hidden in the experimental datasets to compositional data stored in the computational database. In this study, we use the obtained data to construct materials maps, which visualize the relation in the structural features of materials, aiming to support study by the experimental researchers. The map is constructed using the MatDeepLearn (MDL) framework, which implements the graph-based representation of material structures, deep learning, and dimensional reduction for the map construction. We evaluate the obtained materials maps through statistical analysis and found that the MDL using message passing neural network (MPNN) enables efficient extraction of features that reflect the structural complexity of materials. Moreover, we found that this advantage does not necessarily translate into improved accuracy in predicting material properties. We attribute this unexpected outcome to the high learning performance inherent in MPNN, which can contribute to the structuring of data points within the materials map.
- Abstract(参考訳): 材料科学とデータ科学の統合から生まれた材料情報学(MI)は、材料発見と開発を大幅に効率化することが期待されている。
MIに使用されるデータは、計算と実験の両方から得られるが、それらの統合は依然として困難である。
前回の研究では、実験データセットに隠されたトレンドを、計算データベースに格納された合成データにキャプチャする機械学習モデルを適用して、これらのデータセットの統合を報告した。
本研究では, 得られたデータを用いて材料地図を構築し, 材料の構造的特徴との関係を可視化し, 実験者による研究を支援することを目的とした。
このマップはMatDeepLearn (MDL) フレームワークを用いて構築され、物質構造のグラフベース表現、深層学習、地図構築の次元還元を実装している。
得られた材料マップを統計解析により評価した結果,MPNNを用いたMDLは,材料の構造的複雑さを反映した特徴の効率的な抽出を可能にすることがわかった。
さらに, この利点は, 材料特性の予測精度の向上に必ずしも寄与しないことがわかった。
この予期せぬ結果は,MPNN固有の学習性能に起因し,資料マップ内のデータポイントの構造化に寄与すると考えられる。
関連論文リスト
- Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文 参考訳(メタデータ) (2025-03-18T02:14:49Z) - Emerging Microelectronic Materials by Design: Navigating Combinatorial Design Space with Scarce and Dispersed Data [42.45821602529994]
材料設計には計算モデリングと機械学習が用いられている。
物理機構、第一原理計算のコスト、データの分散は、物理に基づく材料モデリングとデータ駆動材料モデリングの両方に課題をもたらす。
本稿では,これらの課題に対処し,材料設計を加速するために,データ駆動および物理に基づく手法を統合するフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-23T05:06:19Z) - DARWIN 1.5: Large Language Models as Materials Science Adapted Learners [46.7259033847682]
DARWIN 1.5は,材料科学に適したオープンソースの大規模言語モデルである。
DARWINはタスク固有の記述子の必要性を排除し、材料特性の予測と発見に対する柔軟な統一的なアプローチを可能にする。
提案手法は,6Mの物質ドメイン論文と49,256の物質から得られた21の実験データセットを統合し,タスク間の知識伝達を可能にする。
論文 参考訳(メタデータ) (2024-12-16T16:51:27Z) - Foundation Model for Composite Materials and Microstructural Analysis [0.0]
複合材料に特化して設計された基礎モデルを提案する。
本研究は, 複合材料における基礎モデルの有効性と有効性について検証した。
このフレームワークは実験データが少ない場合でも高精度な予測を可能にする。
論文 参考訳(メタデータ) (2024-11-10T19:06:25Z) - Knowledge-Aware Reasoning over Multimodal Semi-structured Tables [85.24395216111462]
本研究では、現在のAIモデルがマルチモーダルな構造化データに基づいて知識を考慮した推論を行うことができるかどうかを検討する。
この目的のために設計された新しいデータセットであるMMTabQAを紹介する。
我々の実験は、複数のテキストと画像の入力を効果的に統合し解釈する上で、現在のAIモデルに対する重大な課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-08-25T15:17:43Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - Images in Discrete Choice Modeling: Addressing Data Isomorphism in
Multi-Modality Inputs [77.54052164713394]
本稿では,離散選択モデリング(DCM)と機械学習の交わりについて考察する。
本稿では,DCMフレームワーク内の従来の表型入力と同型情報を共有する高次元画像データの埋め込み結果について検討する。
論文 参考訳(メタデータ) (2023-12-22T14:33:54Z) - Multimodal Foundation Models for Material Property Prediction and Discovery [7.167520424757711]
材料の基礎モデルの自己教師型マルチモーダルトレーニングを可能にするマルチモーダル・ラーニング・フォー・マテリアル(MultiMat)を紹介した。
複数の軸上のMaterial Projectデータベースからのデータを用いて,MultiMatの可能性を示す。
論文 参考訳(メタデータ) (2023-11-30T18:35:29Z) - Multimodal machine learning for materials science: composition-structure
bimodal learning for experimentally measured properties [4.495968252019426]
本稿では,構成構造ビモーダル学習による材料科学におけるマルチモーダル機械学習の新しいアプローチを提案する。
提案するCOSNetは,不完全な構造情報を持つ実験材料特性の学習と予測を強化するために設計されている。
論文 参考訳(メタデータ) (2023-08-04T02:04:52Z) - Large Language Models as Master Key: Unlocking the Secrets of Materials
Science with GPT [9.33544942080883]
本稿では,物質科学におけるデバイスレベルでの情報抽出の複雑さに対処するため,構造化情報推論(SII)と呼ばれる自然言語処理(NLP)タスクを提案する。
我々は、既存のペロブスカイト型太陽電池FAIRデータセットに91.8%のF1スコアでGPT-3をチューニングし、リリース以来のデータでデータセットを拡張した。
また、太陽電池の電気性能を予測する実験を設計し、大規模言語モデル(LLM)を用いてターゲットパラメータを持つ材料や装置の設計を行った。
論文 参考訳(メタデータ) (2023-04-05T04:01:52Z) - Deep autoencoders for physics-constrained data-driven nonlinear
materials modeling [0.6445605125467573]
物理制約付きデータ駆動コンピューティング(英: Physics-Constrained data-driven computing)は、物質データベースを直接ベースとした複雑な物質のシミュレーションを可能にする新しい計算パラダイムである。
本稿では、非線形材料モデリングにおけるこれらの基本的な問題に対処するための、データ駆動型フレームワークに基づくディープラーニング技術を紹介する。
オフラインでトレーニングされたオートエンコーダと検出された埋め込みスペースは、オンラインデータ駆動計算に組み込まれる。
論文 参考訳(メタデータ) (2022-09-03T20:13:47Z) - Interpretable Mixture of Experts [71.55701784196253]
Interpretable Mixture of Experts (IME)は本質的に解釈可能なモデリングフレームワークである。
IMEは単一の解釈可能なモデルよりも正確であることが示され、既存の最先端のDeep Neural Networks(DNN)と正確に比較できる。
IMEの説明は、ユーザスタディを通じて一般的に使われているポストホックな説明法と比較される。
論文 参考訳(メタデータ) (2022-06-05T06:40:15Z) - Audacity of huge: overcoming challenges of data scarcity and data
quality for machine learning in computational materials discovery [1.0036312061637764]
機械学習(ML)に加速された発見は、予測構造とプロパティの関係を明らかにするために大量の高忠実度データを必要とする。
材料発見に関心を持つ多くの特性において、データ生成の挑戦的な性質と高いコストは、人口が少なく、疑わしい品質を持つデータランドスケープを生み出している。
手作業によるキュレーションがなければ、より洗練された自然言語処理と自動画像解析により、文献から構造-プロパティ関係を学習できるようになる。
論文 参考訳(メタデータ) (2021-11-02T21:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。