論文の概要: Pure Component Property Estimation Framework Using Explainable Machine Learning Methods
- arxiv url: http://arxiv.org/abs/2505.09783v1
- Date: Wed, 14 May 2025 20:21:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.099143
- Title: Pure Component Property Estimation Framework Using Explainable Machine Learning Methods
- Title(参考訳): 説明可能な機械学習手法を用いた純粋成分特性推定フレームワーク
- Authors: Jianfeng Jiao, Xi Gao, Jie Li,
- Abstract要約: 結合行列に基づく分子表現法は、原子結合関係を効果的に考慮し、特徴を自動生成する。
ニューラルネットワークとガウス過程回帰モデルを用いて, 通常の沸点 (Tb), 液体モル体積, 臨界温度 (Tc) および臨界圧力 (Pc) の予測結果を得た。
モデルの解釈可能性を高めるために,Shapley値に基づく特徴解析手法を用いて特性予測への各特徴の寄与を決定する。
- 参考スコア(独自算出の注目度): 4.8601239628666635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate prediction of pure component physiochemical properties is crucial for process integration, multiscale modeling, and optimization. In this work, an enhanced framework for pure component property prediction by using explainable machine learning methods is proposed. In this framework, the molecular representation method based on the connectivity matrix effectively considers atomic bonding relationships to automatically generate features. The supervised machine learning model random forest is applied for feature ranking and pooling. The adjusted R2 is introduced to penalize the inclusion of additional features, providing an assessment of the true contribution of features. The prediction results for normal boiling point (Tb), liquid molar volume, critical temperature (Tc) and critical pressure (Pc) obtained using Artificial Neural Network and Gaussian Process Regression models confirm the accuracy of the molecular representation method. Comparison with GC based models shows that the root-mean-square error on the test set can be reduced by up to 83.8%. To enhance the interpretability of the model, a feature analysis method based on Shapley values is employed to determine the contribution of each feature to the property predictions. The results indicate that using the feature pooling method reduces the number of features from 13316 to 100 without compromising model accuracy. The feature analysis results for Tb, Tc, and Pc confirms that different molecular properties are influenced by different structural features, aligning with mechanistic interpretations. In conclusion, the proposed framework is demonstrated to be feasible and provides a solid foundation for mixture component reconstruction and process integration modelling.
- Abstract(参考訳): プロセス統合,マルチスケールモデリング,最適化には,純粋成分物理化学的特性の正確な予測が不可欠である。
本研究では、説明可能な機械学習手法を用いて、純粋なコンポーネント特性予測のための拡張フレームワークを提案する。
本フレームワークでは, 結合行列に基づく分子表現法により, 原子結合関係を効果的に検討し, 特徴を自動生成する。
教師付き機械学習モデルランダムフォレストは、特徴ランク付けとプーリングに適用される。
調整されたR2は、追加のフィーチャを含むことを罰し、特徴の真の寄与を評価するために導入された。
The prediction results for normal boiling point (Tb), liquid molar volume, critical temperature (Tc) and critical pressure (Pc) obtained using Artificial Neural Network and Gaussian Process Regression model confirmed the accuracy of the molecular representation method。
GCベースのモデルと比較すると、テストセットのルート平均二乗誤差は最大83.8%削減できる。
モデルの解釈可能性を高めるために,Shapley値に基づく特徴解析手法を用いて特性予測への各特徴の寄与を決定する。
その結果, モデル精度を損なうことなく, 機能プーリング法により特徴量を13316から100に削減できることが示唆された。
Tb、Tc、Pcの特徴解析の結果、異なる分子特性が異なる構造的特徴に影響され、機械的解釈と一致していることが確認された。
結論として,提案するフレームワークが実現可能であることを実証し,複合コンポーネント再構築とプロセス統合モデリングのための基盤を提供する。
関連論文リスト
- Targeting the partition function of chemically disordered materials with a generative approach based on inverse variational autoencoders [0.0]
そこで本研究では,生成機械学習を用いて特性評価を行う手法を提案する。
本手法では,エンコーダとデコーダの逆の役割を持つ特定の種類の変分オートエンコーダを用いる。
本稿では, (U, Pu)O2混合酸化物燃料における点欠陥生成エネルギーと濃度の計算によるアプローチについて述べる。
論文 参考訳(メタデータ) (2024-08-27T10:05:37Z) - Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Monte Carlo Neural PDE Solver for Learning PDEs via Probabilistic Representation [59.45669299295436]
教師なしニューラルソルバのトレーニングのためのモンテカルロPDEソルバを提案する。
我々は、マクロ現象をランダム粒子のアンサンブルとみなすPDEの確率的表現を用いる。
対流拡散, アレン・カーン, ナヴィエ・ストークス方程式に関する実験により, 精度と効率が著しく向上した。
論文 参考訳(メタデータ) (2023-02-10T08:05:19Z) - A deep learning driven pseudospectral PCE based FFT homogenization
algorithm for complex microstructures [68.8204255655161]
提案手法は,従来の手法よりも高速に評価できる一方で,興味の中心モーメントを予測できることを示す。
提案手法は,従来の手法よりも高速に評価できると同時に,興味の中心モーメントを予測できることを示す。
論文 参考訳(メタデータ) (2021-10-26T07:02:14Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - ResAtom System: Protein and Ligand Affinity Prediction Model Based on
Deep Learning [1.1493209685387984]
我々は,resnetニューラルネットワークを用いたタンパク質リガンド親和性予測モデルを構築した。
その結果,ResAtom-Scoreと組み合わせてDeltaVinaRF20を用いることで,スコア関数に近い親和性予測が実現できることがわかった。
論文 参考訳(メタデータ) (2021-04-17T15:37:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。