論文の概要: A Systematic Evaluation of Molecular Mixture Behavior Prediction
- arxiv url: http://arxiv.org/abs/2605.29698v1
- Date: Thu, 28 May 2026 09:58:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 05:02:24.571617
- Title: A Systematic Evaluation of Molecular Mixture Behavior Prediction
- Title(参考訳): 分子混合挙動予測の体系的評価
- Authors: Roel J. Leenhouts, Nathan K. Morgan, William Green, Jan G. Rittig, Florence H. Vermeire,
- Abstract要約: 本稿では,混合確率誤差を純粋成分と相互作用成分(非理想成分)に分解する評価フレームワークを提案する。
強い絶対精度は、非理想的混合行動の回復不良を隠蔽できることを示す。
これらの結果は、未知の分子への移動が、分子混合機械学習における中心的な課題であることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning for molecular property prediction has focused largely on pure compounds, even though many practical applications depend on mixtures with intermolecular interactions. Recent work has expanded the availability of mixture datasets, but evaluation still focuses mainly on absolute accuracy. However, absolute errors in mixtures conflate pure-component contributions with deviations from ideal mixing. We propose an evaluation framework that decomposes mixture-property error into pure-compound and interaction (non-ideal) components. The framework combines leakage-aware split protocols, ideal-mixture baselines, and excess-property metrics. To support reproducible benchmarking, we curate seven matched pure and mixture physicochemical property datasets. Across multiple mixture-property tasks and model families, we find that strong absolute accuracy can mask poor recovery of non-ideal mixture behavior, and that performance drops substantially under strict molecule splits. These results identify transfer to unseen molecules as a central challenge in molecular mixture machine learning and motivate evaluation beyond absolute accuracy alone.
- Abstract(参考訳): 分子特性予測のための機械学習は、多くの実用的な応用が分子間相互作用の混合物に依存しているにもかかわらず、主に純粋な化合物に焦点を当てている。
最近の研究は混合データセットの可用性を拡大しているが、評価は依然として絶対精度に重点を置いている。
しかし、混合物中の絶対誤差は、理想的な混合から逸脱した純粋成分の寄与を説明できる。
本稿では,混合確率誤差を純粋成分と相互作用成分(非理想成分)に分解する評価フレームワークを提案する。
このフレームワークは、リーク対応のスプリットプロトコル、理想的な混合ベースライン、過剰なプロパティメトリクスを組み合わせたものだ。
再現性ベンチマークを支援するため、7つのマッチングされた純粋および混合物理化学的特性データセットをキュレートした。
複数の混合確率タスクとモデルファミリーで、強い絶対精度は、非理想的混合挙動の回復不良を隠蔽し、厳密な分子分裂の下では性能が著しく低下することを発見した。
これらの結果は、分子混合機械学習において、未知の分子への移動が中心的な課題であると認識し、絶対精度以上の評価を動機付ける。
関連論文リスト
- ChemFlow:A Hierarchical Neural Network for Multiscale Representation Learning in Chemical Mixtures [10.457130454437696]
ChemFlowは、原子、官能基、分子レベルの機能を統合した新しい階層型フレームワークである。
ChemFlowは濃度依存特性の予測に優れ、最先端モデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2026-03-03T09:54:34Z) - AROMMA: Unifying Olfactory Embeddings for Single Molecules and Mixtures [1.9872740012524774]
AROMMAは単一分子と2分子混合体に対する統一的な埋め込み空間を学習するフレームワークである。
AROMMAは、単一分子と分子対のデータセットの両方で最先端のパフォーマンスを達成し、最大19.1%のAUROCを改善した。
論文 参考訳(メタデータ) (2026-01-27T12:54:31Z) - Learning Continuous Solvent Effects from Transient Flow Data: A Graph Neural Network Benchmark on Catechol Rearrangement [0.0]
この研究は、高スループットな過渡的フロー化学データセットである textbfCatechol Benchmarkを導入している。
化学環境への一般化を実証するため, 厳密な溶出・溶出プロトコルおよび溶出・溶出プロトコルによる各種アーキテクチャの評価を行った。
本稿では,グラフ注意ネットワーク(GAT)と差動反応フィンガープリント(DRFP)を統合し,混合認識符号化を学習するハイブリッドGNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-12-22T16:19:01Z) - CheMixHub: Datasets and Benchmarks for Chemical Mixture Property Prediction [0.0]
CheMixHubは分子混合物の総合的なベンチマークである。
11種類の化学物質の混合特性予測タスクのコーパスをカバーしており、ドラッグデリバリーの定式化から電池の電解質まで。
CheMixHubは、コンテキスト固有の一般化とモデルロバスト性を評価するために、さまざまなデータ分割技術を導入している。
論文 参考訳(メタデータ) (2025-06-13T21:19:27Z) - Hierarchical Matrix Completion for the Prediction of Properties of Binary Mixtures [3.0478550046333965]
データ駆動モデルを改善するための新しいジェネリックアプローチを導入する。
化学のクラスに同じように振る舞うコンポーネントを持ち込み、それらを共同でモデル化します。
クラスタリングを使用すると、クラスタリングなしのCMに比べて予測が大幅に改善される。
論文 参考訳(メタデータ) (2024-10-08T14:04:30Z) - The Benefits of Mixup for Feature Learning [117.93273337740442]
最初に、機能やラベルに異なる線形パラメータを使用するMixupは、標準Mixupと同様のパフォーマンスが得られることを示す。
我々は、特徴雑音データモデルを検討し、Mixupトレーニングが共通の特徴と組み合わせることで、稀な特徴を効果的に学習できることを示します。
対照的に、標準的なトレーニングは共通の特徴しか学べないが、まれな特徴を学べないため、パフォーマンスが悪くなる。
論文 参考訳(メタデータ) (2023-03-15T08:11:47Z) - Harnessing Hard Mixed Samples with Decoupled Regularizer [69.98746081734441]
Mixupは、決定境界を混合データで滑らかにすることで、ニューラルネットワークの一般化を改善する効率的なデータ拡張アプローチである。
本稿では,非結合型正規化器(Decoupled Mixup, DM)を用いた効率的な混合目標関数を提案する。
DMは、ミキシングの本来の滑らかさを損なうことなく、硬質混合試料を適応的に利用して識別特性をマイニングすることができる。
論文 参考訳(メタデータ) (2022-03-21T07:12:18Z) - Quantum Coherent States of Interacting Bose-Fermi Mixtures in One
Dimension [68.8204255655161]
ボソンとフェルミオンの両方を含む1次元の2成分の原子ガス混合物について検討した。
相互作用の内在的および相対的強度によって異なる多種多様な基底状態相を報告した。
論文 参考訳(メタデータ) (2021-10-26T17:52:37Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Consistent Estimation of Identifiable Nonparametric Mixture Models from
Grouped Observations [84.81435917024983]
この研究は、グループ化された観測から任意の同定可能な混合モデルを一貫して推定するアルゴリズムを提案する。
ペア化された観測のために実践的な実装が提供され、アプローチは既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-06-12T20:44:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。