論文の概要: When does deep learning fail and how to tackle it? A critical analysis
on polymer sequence-property surrogate models
- arxiv url: http://arxiv.org/abs/2210.06622v1
- Date: Wed, 12 Oct 2022 23:04:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 17:38:02.916856
- Title: When does deep learning fail and how to tackle it? A critical analysis
on polymer sequence-property surrogate models
- Title(参考訳): ディープラーニングはいつ失敗し、どのように対処するのか?
高分子配列-プロパタイト代理模型の臨界解析
- Authors: Himanshu and Tarak K Patra
- Abstract要約: ディープラーニングモデルは、高分子特性の予測において人気と有効性を高めている。
これらのモデルは、既存のデータを用いて構築することができ、ポリマー特性の迅速な予測に有用である。
しかし,ディープラーニングモデルの性能は,そのトポロジやトレーニングデータの量と密接に関連している。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models are gaining popularity and potency in predicting polymer
properties. These models can be built using pre-existing data and are useful
for the rapid prediction of polymer properties. However, the performance of a
deep learning model is intricately connected to its topology and the volume of
training data. There is no facile protocol available to select a deep learning
architecture, and there is a lack of a large volume of homogeneous
sequence-property data of polymers. These two factors are the primary
bottleneck for the efficient development of deep learning models. Here we
assess the severity of these factors and propose new algorithms to address
them. We show that a linear layer-by-layer expansion of a neural network can
help in identifying the best neural network topology for a given problem.
Moreover, we map the discrete sequence space of a polymer to a continuous
one-dimensional latent space using a machine learning pipeline to identify
minimal data points for building a universal deep learning model. We implement
these approaches for three representative cases of building sequence-property
surrogate models, viz., the single-molecule radius of gyration of a copolymer,
adhesive free energy of a copolymer, and copolymer compatibilizer,
demonstrating the generality of the proposed strategies. This work establishes
efficient methods for building universal deep learning models with minimal data
and hyperparameters for predicting sequence-defined properties of polymers.
- Abstract(参考訳): ディープラーニングモデルの人気と、高分子特性の予測能力が高まっている。
これらのモデルは既存のデータを用いて構築することができ、ポリマー特性の迅速な予測に有用である。
しかし,ディープラーニングモデルの性能は,そのトポロジやトレーニングデータの量と密接に関連している。
ディープラーニングアーキテクチャを選択するためのfacileプロトコルは存在せず、ポリマーの均質なシーケンス・プロパティーデータを大量に持っていない。
これら2つの要因は、ディープラーニングモデルの効率的な開発における主要なボトルネックである。
ここでは,これらの要因の重大性を評価し,それに対処する新しいアルゴリズムを提案する。
ニューラルネットワークの層別線形展開は,与えられた問題に対する最適なニューラルネットワークトポロジーの同定に有用であることを示す。
さらに, ポリマーの離散列空間を機械学習パイプラインを用いて連続的な一次元潜在空間にマッピングし, 普遍的なディープラーニングモデルを構築するための最小データポイントを同定する。
提案手法は,共重合体のジャイレーション半径の1分子半径,共重合体の接着自由エネルギー,共重合体の共重合体適合剤の3つの代表例に対して実装し,提案手法の汎用性を実証した。
本研究は, 最小データとハイパーパラメータを用いた汎用ディープラーニングモデルの構築法を確立し, ポリマーのシーケンス定義特性を予測する。
関連論文リスト
- Molecular topological deep learning for polymer property prediction [18.602659324026934]
高分子特性解析のための分子トポロジカルディープラーニング(Mol-TDL)を開発した。
Mol-TDLは高次相互作用とマルチスケール特性の両方をトポロジカルディープラーニングアーキテクチャに組み込んでいる。
論文 参考訳(メタデータ) (2024-10-07T05:44:02Z) - Extrapolative ML Models for Copolymers [1.901715290314837]
機械学習モデルは、材料特性の予測に徐々に使われてきた。
これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。
本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文 参考訳(メタデータ) (2024-09-15T11:02:01Z) - A Deep Dive into the Connections Between the Renormalization Group and
Deep Learning in the Ising Model [0.0]
再正規化群(Renormalization group、RG)は、統計物理学と量子場理論において必須の手法である。
本研究では, 1D と 2D Ising モデルに対する広範な再正規化手法を開発し, 比較のためのベースラインを提供する。
2次元イジングモデルでは、Wolffアルゴリズムを用いてIsingモデルサンプルを生成し、準決定論的手法を用いてグループフローを実行した。
論文 参考訳(メタデータ) (2023-08-21T22:50:54Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z) - Characterizing the Latent Space of Molecular Deep Generative Models with
Persistent Homology Metrics [21.95240820041655]
変分オート(VAE)は、エンコーダとデコーダのネットワークペアをトレーニングデータ分散の再構築のために訓練する生成モデルである。
本研究では, 深部生成モデルの潜伏空間が, 構造的および化学的特徴をエンコードできるかどうかを計測する手法を提案する。
論文 参考訳(メタデータ) (2020-10-18T13:33:02Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。