論文の概要: Polymer Informatics with Multi-Task Learning
- arxiv url: http://arxiv.org/abs/2010.15166v1
- Date: Wed, 28 Oct 2020 18:28:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 06:30:56.410432
- Title: Polymer Informatics with Multi-Task Learning
- Title(参考訳): マルチタスク学習による高分子インフォマティクス
- Authors: Christopher K\"unneth, Arunkumar Chitteth Rajan, Huan Tran, Lihua
Chen, Chiho Kim, Rampi Ramprasad
- Abstract要約: 固有相関を効果的に活用するマルチタスク学習手法の有用性を示す。
13,000ドルを超えるポリマーの36種類の異なる性質に関するデータは、統合され、ディープラーニングマルチタスクアーキテクチャに供給される。
マルチタスクのアプローチは正確で、効率的で、スケーラブルで、同じまたは異なるプロパティ上のより多くのデータが利用可能になると、学習を転送できる。
- 参考スコア(独自算出の注目度): 0.06524460254566902
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern data-driven tools are transforming application-specific polymer
development cycles. Surrogate models that can be trained to predict the
properties of new polymers are becoming commonplace. Nevertheless, these models
do not utilize the full breadth of the knowledge available in datasets, which
are oftentimes sparse; inherent correlations between different property
datasets are disregarded. Here, we demonstrate the potency of multi-task
learning approaches that exploit such inherent correlations effectively,
particularly when some property dataset sizes are small. Data pertaining to 36
different properties of over $13, 000$ polymers (corresponding to over $23,000$
data points) are coalesced and supplied to deep-learning multi-task
architectures. Compared to conventional single-task learning models (that are
trained on individual property datasets independently), the multi-task approach
is accurate, efficient, scalable, and amenable to transfer learning as more
data on the same or different properties become available. Moreover, these
models are interpretable. Chemical rules, that explain how certain features
control trends in specific property values, emerge from the present work,
paving the way for the rational design of application specific polymers meeting
desired property or performance objectives.
- Abstract(参考訳): 現代のデータ駆動ツールは、アプリケーション固有のポリマー開発サイクルを変えつつある。
新しいポリマーの性質を予測するために訓練できるサロゲートモデルが一般的になりつつある。
にもかかわらず、これらのモデルはデータセットで利用可能な知識の完全な広さを利用せず、しばしばスパースであり、異なるプロパティデータセット間の固有の相関は無視される。
本稿では,このような固有相関を効果的に活用するマルチタスク学習手法の有効性を示す。
13,000ドルを超えるポリマー(データポイント23,000ドル以上に相当する)の36の異なる特性に関するデータは統合され、ディープラーニングマルチタスクアーキテクチャに供給される。
従来のシングルタスク学習モデル(個々のプロパティデータセットで個別にトレーニングされている)と比較して、マルチタスクアプローチは正確で、効率的で、スケーラブルで、同じあるいは異なるプロパティでより多くのデータが利用可能になると、学習を転送できる。
さらに、これらのモデルは解釈可能である。
特定の特徴が特定の特性値のトレンドを制御する方法を説明する化学規則は、現在の研究から生まれ、望まれる特性や性能の目的を満たすアプリケーション固有のポリマーの合理的な設計の道を開く。
関連論文リスト
- Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning [79.75718786477638]
我々は、それらを接続する物理法則が存在する分子的タスクの専門性を生かし、整合性トレーニングアプローチを設計する。
より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、構造予測を改善するために、力と非平衡構造データを直接活用できることがわかった。
論文 参考訳(メタデータ) (2024-10-14T03:11:33Z) - Extrapolative ML Models for Copolymers [1.901715290314837]
機械学習モデルは、材料特性の予測に徐々に使われてきた。
これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。
本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文 参考訳(メタデータ) (2024-09-15T11:02:01Z) - Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。
複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文 参考訳(メタデータ) (2024-08-29T03:58:21Z) - Multi-Task Multi-Fidelity Learning of Properties for Energetic Materials [34.8008617873679]
マルチタスクニューラルネットワークは、マルチモーダルデータから学習でき、特定の特性のために訓練されたシングルタスクモデルより優れている。
予想通り、データスカースプロパティでは改善がより重要になります。
このアプローチは、エネルギー材料以外の分野にも広く適用できる。
論文 参考訳(メタデータ) (2024-08-21T12:54:26Z) - Towards Foundational Models for Molecular Learning on Large-Scale
Multi-Task Datasets [42.401713168958445]
ToyMix, LargeMix, UltraLargeの3つのカテゴリに分類される。
これらのデータセットは、分子学習のための教師付きラベルのスケールと多様性の両方の境界を押し上げます。
また,提案したデータセットに基づく基礎モデルの開発を支援するため,Graphiumグラフ機械学習ライブラリを提案する。
論文 参考訳(メタデータ) (2023-10-06T14:51:17Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - When does deep learning fail and how to tackle it? A critical analysis
on polymer sequence-property surrogate models [1.0152838128195467]
ディープラーニングモデルは、高分子特性の予測において人気と有効性を高めている。
これらのモデルは、既存のデータを用いて構築することができ、ポリマー特性の迅速な予測に有用である。
しかし,ディープラーニングモデルの性能は,そのトポロジやトレーニングデータの量と密接に関連している。
論文 参考訳(メタデータ) (2022-10-12T23:04:10Z) - Multi-objective Deep Data Generation with Correlated Property Control [23.99970130388449]
本稿では,非絡み付き潜在ベクトルによる意味論と特性の相関を復元する,新しい深層生成フレームワークを提案する。
我々の生成モデルは,多目的最適化フレームワークの下で,特性の相関と矛盾を扱いながら,興味のある特性を保存します。
論文 参考訳(メタデータ) (2022-10-01T00:35:45Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。