論文の概要: PolySet: Restoring the Statistical Ensemble Nature of Polymers for Machine Learning
- arxiv url: http://arxiv.org/abs/2512.13186v1
- Date: Mon, 15 Dec 2025 10:50:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.627048
- Title: PolySet: Restoring the Statistical Ensemble Nature of Polymers for Machine Learning
- Title(参考訳): PolySet: 機械学習のための高分子の統計的アンサンブル特性の復元
- Authors: Khalid Ferji,
- Abstract要約: 重合体を仮定したモル質量分布からサンプリングした鎖の有限重み付けアンサンブルとして表現するフレームワークであるPolySetを紹介する。
高分子物質の統計的性質を明確に認識することで、PolySetは将来の高分子機械学習のための物理的基盤を確立する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine-learning (ML) models in polymer science typically treat a polymer as a single, perfectly defined molecular graph, even though real materials consist of stochastic ensembles of chains with distributed lengths. This mismatch between physical reality and digital representation limits the ability of current models to capture polymer behaviour. Here we introduce PolySet, a framework that represents a polymer as a finite, weighted ensemble of chains sampled from an assumed molar-mass distribution. This ensemble-based encoding is independent of chemical detail, compatible with any molecular representation and illustrated here in the homopolymer case using a minimal language model. We show that PolySet retains higher-order distributional moments (such as Mz, Mz+1), enabling ML models to learn tail-sensitive properties with greatly improved stability and accuracy. By explicitly acknowledging the statistical nature of polymer matter, PolySet establishes a physically grounded foundation for future polymer machine learning, naturally extensible to copolymers, block architectures, and other complex topologies.
- Abstract(参考訳): 高分子科学における機械学習(ML)モデルは通常、ポリマーを1つの完全に定義された分子グラフとして扱うが、実際の材料は、長さが分散した鎖の確率的アンサンブルで構成されている。
この物理的現実とデジタル表現のミスマッチは、現在のモデルがポリマーの挙動を捉える能力を制限している。
ここでは, 重合体を仮定したモル質量分布から採取した鎖の有限重み付けアンサンブルとして表現するフレームワークであるPolySetを紹介する。
このアンサンブルに基づくエンコーディングは化学的詳細とは独立であり、どんな分子表現とも互換性があり、ここでは最小言語モデルを用いてホモポリマーのケースで示される。
ポリセットは高次分布モーメント(Mz, Mz+1)を保ち, MLモデルでテール感度特性を学習し, 安定性と精度を大幅に向上することを示した。
高分子物質の統計的性質を明確に認識することで、PolySetは将来の高分子機械学習の物理的基盤を確立し、コポリマー、ブロックアーキテクチャ、その他の複雑なトポロジーに自然に拡張できる。
関連論文リスト
- MIPS: a Multimodal Infinite Polymer Sequence Pre-training Framework for Polymer Property Prediction [18.637780346409308]
既存のモデリングアプローチは、通常は構成モノマーによってポリマーを表すが、ポリマーの全ての性質を捉えるのに苦労している。
本稿では, 高分子をモノマーの無限列として表現するMIPS事前学習フレームワークを提案する。
トポロジカルな観点から、メッセージパッシング機構(MPM)とグラフアテンション機構(GAM)を無限のポリマー配列に一般化する。
論文 参考訳(メタデータ) (2025-07-27T15:34:51Z) - POINT$^{2}$: A Polymer Informatics Training and Testing Database [15.45788515943579]
POINT$2$ (Polymer Informatics Training and Testing) は、高分子情報学における重要な課題に対処するために設計されたベンチマークデータベースとプロトコルである。
我々は、量子ランダムフォレスト、ドロップアウト付き多層パーセプトロン、グラフニューラルネットワーク、事前訓練された大規模言語モデルを含むMLモデルのアンサンブルを開発する。
これらのモデルは、Morgan、MACCS、RDKit、Topological、Atom Pairの指紋、グラフベースの記述子といった多様なポリマー表現と結合している。
論文 参考訳(メタデータ) (2025-03-30T15:46:01Z) - Multimodal machine learning with large language embedding model for polymer property prediction [2.525624865489335]
本稿では,高分子特性予測タスクに対して,単純で効果的なマルチモーダルアーキテクチャであるPolyLLMemを提案する。
PolyLLMemは、Llama 3によって生成されたテキスト埋め込みとUni-Mol由来の分子構造埋め込みを統合する。
その性能は、グラフベースのモデルやトランスフォーマーベースのモデルと同等であり、場合によってはそれ以上である。
論文 参考訳(メタデータ) (2025-03-29T03:48:11Z) - Compositional Representation of Polymorphic Crystalline Materials [56.80318252233511]
PCRLは,構成の確率論的モデリングを用いて,利用可能な構造情報から多型を抽出する手法である。
16のデータセットに対する広範囲な評価は、構成表現の学習におけるPCRLの有効性を示す。
論文 参考訳(メタデータ) (2023-11-17T20:34:28Z) - Automatically Predict Material Properties with Microscopic Image Example
Polymer Compatibility [94.40113383292139]
機械学習を用いたコンピュータ画像認識は、人工判定の欠陥を補うことができる。
畳み込みニューラルネットワークとトランスファーラーニング手法を用いて、自動誤認認識を実現する。
提案手法は, 各種材料の微細構造と物性の定量的評価に広く応用できる。
論文 参考訳(メタデータ) (2023-03-22T07:51:32Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - PAC Reinforcement Learning for Predictive State Representations [60.00237613646686]
部分的に観察可能な力学系におけるオンライン強化学習(RL)について検討する。
我々は、他のよく知られたモデルをキャプチャする表現モデルである予測状態表現(PSR)モデルに焦点を当てる。
我々は,サンプル複雑性のスケーリングにおいて,ほぼ最適なポリシを学習可能な,PSRのための新しいモデルベースアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-07-12T17:57:17Z) - A graph representation of molecular ensembles for polymer property
prediction [3.032184156362992]
有機分子とは対照的に、ポリマーはよく定義された単一構造ではなく、類似した分子の集合体である。
本稿では,分子アンサンブルのグラフ表現と,高分子特性予測に適したグラフニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-05-17T20:31:43Z) - Geometric Transformer for End-to-End Molecule Properties Prediction [92.28929858529679]
分子特性予測のためのトランスフォーマーに基づくアーキテクチャを導入し,分子の形状を捉える。
分子幾何学の初期符号化による古典的な位置エンコーダと、学習されたゲート自己保持機構を改変する。
論文 参考訳(メタデータ) (2021-10-26T14:14:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。