論文の概要: Thermodynamic Prediction Enabled by Automatic Dataset Building and Machine Learning
- arxiv url: http://arxiv.org/abs/2507.07293v1
- Date: Wed, 09 Jul 2025 21:33:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-11 16:40:15.21064
- Title: Thermodynamic Prediction Enabled by Automatic Dataset Building and Machine Learning
- Title(参考訳): 自動データセット構築と機械学習による熱力学予測
- Authors: Juejing Liu, Haydn Anderson, Noah I. Waxman, Vsevolod Kovalev, Byron Fisher, Elizabeth Li, Xiaofeng Guo,
- Abstract要約: 化学と材料科学の新しい発見は、機械学習(ML)が研究効率を加速する上で重要な役割を果たす機会を提供する。
本稿では,(1)自動文献レビューにおける大規模言語モデル(LLM)の利用,(2)化学知識(熱力学パラメータ)を予測するためのMLモデルの訓練について述べる。
この研究は、化学と材料科学の研究を再形成するための統合MLアプローチの変革の可能性を強調している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: New discoveries in chemistry and materials science, with increasingly expanding volume of requisite knowledge and experimental workload, provide unique opportunities for machine learning (ML) to take critical roles in accelerating research efficiency. Here, we demonstrate (1) the use of large language models (LLMs) for automated literature reviews, and (2) the training of an ML model to predict chemical knowledge (thermodynamic parameters). Our LLM-based literature review tool (LMExt) successfully extracted chemical information and beyond into a machine-readable structure, including stability constants for metal cation-ligand interactions, thermodynamic properties, and other broader data types (medical research papers, and financial reports), effectively overcoming the challenges inherent in each domain. Using the autonomous acquisition of thermodynamic data, an ML model was trained using the CatBoost algorithm for accurately predicting thermodynamic parameters (e.g., enthalpy of formation) of minerals. This work highlights the transformative potential of integrated ML approaches to reshape chemistry and materials science research.
- Abstract(参考訳): 化学と材料科学における新たな発見は、必要な知識と実験的な作業量の増加と共に、機械学習(ML)が研究効率を加速する上で重要な役割を果たす機会を提供する。
本稿では,(1)自動文献レビューにおける大規模言語モデル(LLM)の利用,(2)化学知識(熱力学パラメータ)を予測するためのMLモデルのトレーニングについて述べる。
LLMベースの文献レビューツール(LMExt)は,金属カチオン-リガンド相互作用の安定性定数,熱力学特性,その他の広範囲なデータ型(医学研究論文,財務報告)を含む機械可読構造に化学情報を抽出し,各領域に固有の課題を効果的に克服することに成功した。
熱力学データの自律的取得を用いて,鉱物の熱力学的パラメータ(例えば生成エンタルピー)を正確に予測するCatBoostアルゴリズムを用いてMLモデルを訓練した。
この研究は、化学と材料科学の研究を再形成するための統合MLアプローチの変革の可能性を強調している。
関連論文リスト
- ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Machine Learning - Driven Materials Discovery: Unlocking Next-Generation Functional Materials -- A minireview [0.0]
機械学習(ML)によるアプローチは、材料発見、プロパティ予測、マテリアルデザインに革命をもたらしている。
このレビューでは、材料の機械的、熱的、電気的、光学的特性を予測するML駆動方式の現実的な応用を強調した。
最終的に、AI、自動実験、および計算モデリングの相乗効果は、材料の検出、最適化、設計の方法を変える。
論文 参考訳(メタデータ) (2025-03-22T15:24:38Z) - Ensemble Knowledge Distillation for Machine Learning Interatomic Potentials [34.82692226532414]
機械学習の原子間ポテンシャル(MLIP)を改善するためのアンサンブル知識蒸留法(EKD)を提案する。
まず、複数の教師モデルはQCエネルギーに訓練され、次にデータセットのすべての構成に対して原子力を生成する。次に、学生MLIPは、教師モデルによって生成されたQCエネルギーと平均的な力の両方に訓練される。
得られた学生MLIPは、Compum6ベンチマークで新しい最先端の精度を達成し、分子動力学シミュレーションの安定性の向上を示す。
論文 参考訳(メタデータ) (2025-03-18T14:32:51Z) - Recent Advances on Machine Learning for Computational Fluid Dynamics: A Survey [51.87875066383221]
本稿では、基本概念、従来の手法、ベンチマークデータセットを紹介し、CFDを改善する上で機械学習が果たす様々な役割について検討する。
我々は,空気力学,燃焼,大気・海洋科学,生物流体,プラズマ,記号回帰,秩序の低減など,CFDにおけるMLの現実的な応用を強調した。
シミュレーションの精度を向上し、計算時間を短縮し、流体力学のより複雑な解析を可能にすることにより、MLはCFD研究を大きく変革する可能性があるという結論を導いた。
論文 参考訳(メタデータ) (2024-08-22T07:33:11Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Physics-Informed Machine Learning for Modeling and Control of Dynamical
Systems [0.0]
物理インフォームド機械学習(英: Physics-informed machine learning、PIML)は、機械学習(ML)アルゴリズムを物理的制約と体系的に統合する手法とツールのセットである。
PIMLの基本前提は、MLと物理の統合により、より効率的で、物理的に一貫性があり、データ効率のよいモデルが得られることである。
本稿では,動的システムモデリングと制御のためのPIMLの最近の進歩について,チュートリアルのような概要を提供する。
論文 参考訳(メタデータ) (2023-06-24T05:24:48Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。