論文の概要: Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures
- arxiv url: http://arxiv.org/abs/2410.06060v1
- Date: Tue, 8 Oct 2024 14:04:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-01 11:20:35.658145
- Title: Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures
- Title(参考訳): 2成分混合系の特性予測のための階層行列補完
- Authors: Dominik Gond, Jan-Tobias Sohns, Heike Leitte, Hans Hasse, Fabian Jirasek,
- Abstract要約: データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。
化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
- 参考スコア(独自算出の注目度): 3.0478550046333965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the thermodynamic properties of mixtures is crucial for process design and optimization in chemical engineering. Machine learning (ML) methods are gaining increasing attention in this field, but experimental data for training are often scarce, which hampers their application. In this work, we introduce a novel generic approach for improving data-driven models: inspired by the ancient rule "similia similibus solvuntur", we lump components that behave similarly into chemical classes and model them jointly in the first step of a hierarchical approach. While the information on class affiliations can stem in principle from any source, we demonstrate how classes can reproducibly be defined based on mixture data alone by agglomerative clustering. The information from this clustering step is then used as an informed prior for fitting the individual data. We demonstrate the benefits of this approach by applying it in connection with a matrix completion method (MCM) for predicting isothermal activity coefficients at infinite dilution in binary mixtures. Using clustering leads to significantly improved predictions compared to an MCM without clustering. Furthermore, the chemical classes learned from the clustering give exciting insights into what matters on the molecular level for modeling given mixture properties.
- Abstract(参考訳): 混合物の熱力学特性の予測は化学工学におけるプロセス設計と最適化に不可欠である。
この分野では機械学習(ML)手法が注目されているが、トレーニングのための実験データはほとんどない。
本研究では、データ駆動モデルを改善するための新しい汎用的アプローチを紹介する。これは、古来の規則「similia similibus solvuntur」にインスパイアされた、化学クラスに類似した振る舞いをするコンポーネントを、階層的アプローチの第一段階において共同でモデル化する。
クラスアフィリエイトに関する情報は原則として任意のソースから得られるが,アグリメティブクラスタリングによって混合データのみに基づいてクラスを再現的に定義する方法を実証する。
このクラスタリングステップからの情報は、個々のデータに適合するための情報事前として使用される。
本稿では, 2成分混合系の無限希釈における等温活性係数を予測するために, 行列完備化法(MCM)と組み合わせて適用することで, このアプローチの利点を実証する。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
さらに、クラスタリングから学んだ化学クラスは、与えられた混合特性をモデル化するために分子レベルに何が重要なのか、エキサイティングな洞察を与える。
関連論文リスト
- Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。
本稿では,FCMを用いたクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T08:15:50Z) - Dendrogram of mixing measures: Hierarchical clustering and model
selection for finite mixture models [5.044813181406083]
本稿では,過度に適合した潜在混合指標から構築した階層的クラスタリング木(デンドログラム)を用いて,混合モデルを要約し,選択する新しい方法を提案する。
提案手法は,集合的階層的クラスタリングと混合モデリングを橋渡しする。
論文 参考訳(メタデータ) (2024-03-04T02:31:53Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Unsupervised Learning of Molecular Embeddings for Enhanced Clustering
and Emergent Properties for Chemical Compounds [2.6803933204362336]
SMILESデータに基づく化合物の検出とクラスタリングのための様々な手法を提案する。
埋め込みデータを用いて化合物のグラフィカルな構造を解析し, しきい値を満たすためにベクトル探索を用いる。
また、GPT3.5を用いたベクトルデータベースに格納された自然言語記述埋め込みを用い、ベースモデルより優れていた。
論文 参考訳(メタデータ) (2023-10-25T18:00:24Z) - Learning Gaussian Mixtures with Generalised Linear Models: Precise
Asymptotics in High-dimensions [79.35722941720734]
多クラス分類問題に対する一般化線形モデルは、現代の機械学習タスクの基本的な構成要素の1つである。
実験的リスク最小化による高次元推定器の精度を実証する。
合成データの範囲を超えて我々の理論をどのように適用できるかを論じる。
論文 参考訳(メタデータ) (2021-06-07T16:53:56Z) - CASTELO: Clustered Atom Subtypes aidEd Lead Optimization -- a combined
machine learning and molecular modeling method [2.8381402107366034]
我々は、リード最適化ワークフローを自動化する機械学習と分子モデリングを組み合わせたアプローチを提案する。
本手法は, 薬剤の有効性向上に有効な, ホットスポットの新規なヒントを提供する。
論文 参考訳(メタデータ) (2020-11-27T15:41:00Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。