論文の概要: Reducing Data Requirements for Sequence-Property Prediction in Copolymer Compatibilizers via Deep Neural Network Tuning
- arxiv url: http://arxiv.org/abs/2507.21902v1
- Date: Tue, 29 Jul 2025 15:12:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.556437
- Title: Reducing Data Requirements for Sequence-Property Prediction in Copolymer Compatibilizers via Deep Neural Network Tuning
- Title(参考訳): ディープニューラルネットワークチューニングによる共重合体適合剤のシーケンス品質予測のためのデータ要求量の削減
- Authors: Md Mushfiqul Islam, Nishat N. Labiba, Lawrence O. Hall, David S. Simmons,
- Abstract要約: シーケンス/界面張力関係のための低忠実度データに基づいて訓練されたディープニューラルネットワークを高速に調整して高忠実度予測を行うことができることを示す。
このプライミング・アンド・チューニングのアプローチでは、単一の低忠実度親データセットが関連するシステム全体の予測と設計を劇的に加速する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Synthetic sequence-controlled polymers promise to transform polymer science by combining the chemical versatility of synthetic polymers with the precise sequence-mediated functionality of biological proteins. However, design of these materials has proven extraordinarily challenging, because they lack the massive datasets of closely related evolved molecules that accelerate design of proteins. Here we report on a new Artifical Intelligence strategy to dramatically reduce the amount of data necessary to accelerate these materials' design. We focus on data connecting the repeat-unit-sequence of a \emph{compatibilizer} molecule to its ability to reduce the interfacial tension between distinct polymer domains. The optimal sequence of these molecules, which are essential for applications such as mixed-waste polymer recycling, depends strongly on variables such as concentration and chemical details of the polymer. With current methods, this would demand an entirely distinct dataset to enable design at each condition. Here we show that a deep neural network trained on low-fidelity data for sequence/interfacial tension relations at one set of conditions can be rapidly tuned to make higher-fidelity predictions at a distinct set of conditions, requiring far less data that would ordinarily be needed. This priming-and-tuning approach should allow a single low-fidelity parent dataset to dramatically accelerate prediction and design in an entire constellation of related systems. In the long run, it may also provide an approach to bootstrapping quantitative atomistic design with AI insights from fast, coarse simulations.
- Abstract(参考訳): 合成配列制御ポリマーは、合成ポリマーの化学的汎用性と生物学的タンパク質の正確な配列制御機能を組み合わせることで、高分子科学を変換することを約束する。
しかし、これらの材料の設計は、タンパク質の設計を加速する近縁な進化分子の膨大なデータセットが欠如しているため、非常に難しいことが証明されている。
本稿では,これらの材料の設計を加速させるために必要なデータ量を劇的に削減する新しい人工知能戦略について報告する。
そこで本研究では,<emph{compatibilizer}分子の繰り返しユニット配列と,異なるポリマードメイン間の界面張力を低減する能力とを結合するデータに焦点をあてる。
これらの分子の最適配列は、混合汚泥ポリマーのリサイクルのような用途に必須であり、ポリマーの濃度や化学的詳細といった変数に強く依存する。
現在のメソッドでは、各条件で設計を可能にするために、まったく異なるデータセットが必要です。
ここでは、一組の条件における配列/界面張力関係のための低忠実度データに基づいて訓練されたディープニューラルネットワークを高速に調整し、異なる条件セットでの高忠実度予測を行い、通常必要となるデータをはるかに少なくすることができることを示す。
このプライミング・アンド・チューニングのアプローチでは、単一の低忠実度親データセットが関連するシステム全体の予測と設計を劇的に加速する。
長期的には、高速で粗いシミュレーションからAIの洞察を得て定量的な原子構造設計をブートストラップするアプローチも提供されるかもしれない。
関連論文リスト
- Generating new coordination compounds via multireference simulations, genetic algorithms and machine learning: the case of Co(II) molecular magnets [41.94295877935867]
本稿では,電子・磁気特性が望ましい新しい配位化合物の発見を加速する計算戦略を提案する。
我々のアプローチは、高スループットab initio法、遺伝的アルゴリズム、機械学習の組み合わせに基づいている。
本研究は,Co(II) 単核配位化合物の磁気特性を実験およびブライト力アブイニシアト法で測定した時間に記録し, 自動生成することで, このアプローチの効率を実証するものである。
論文 参考訳(メタデータ) (2025-04-18T15:33:48Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - Transferring a molecular foundation model for polymer property
predictions [3.067983186439152]
トランスモデルの自己教師付き事前トレーニングには、大規模なデータセットが必要である。
本研究では, 高分子特性を微調整し, 小分子で事前学習したトランスフォーマーを用いることで, 強化ポリマーデータセットでトレーニングしたトランスフォーマーと同等の精度が得られることを示す。
論文 参考訳(メタデータ) (2023-10-25T19:55:00Z) - Fast and Functional Structured Data Generators Rooted in Out-of-Equilibrium Physics [44.97217246897902]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。