論文の概要: Size doesn't matter: predicting physico- or biochemical properties based
on dozens of molecules
- arxiv url: http://arxiv.org/abs/2107.10882v1
- Date: Thu, 22 Jul 2021 18:57:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-27 01:24:33.540375
- Title: Size doesn't matter: predicting physico- or biochemical properties based
on dozens of molecules
- Title(参考訳): サイズは問題ではない:数十の分子に基づく物理・生化学的特性の予測
- Authors: Kirill Karpov (1 and 2), Artem Mitrofanov (1 and 2), Vadim Korolev (1
and 2), Valery Tkachenko (2) ((1) Lomonosov Moscow State University,
Department of Chemistry, Leninskie gory, 1 bld. 3, Moscow, Russia, (2)
Science Data Software, LLC, 14909 Forest Landing Cir, Rockville, USA)
- Abstract要約: 本論文は,データ不足を伴う対象特性のモデルの性能を著しく改善したことを示す。
また,データセット構成がモデル品質および結果モデルの適用性領域に及ぼす影響についても検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of machine learning in chemistry has become a common practice. At the
same time, despite the success of modern machine learning methods, the lack of
data limits their use. Using a transfer learning methodology can help solve
this problem. This methodology assumes that a model built on a sufficient
amount of data captures general features of the chemical compound structure on
which it was trained and that the further reuse of these features on a dataset
with a lack of data will greatly improve the quality of the new model. In this
paper, we develop this approach for small organic molecules, implementing
transfer learning with graph convolutional neural networks. The paper shows a
significant improvement in the performance of models for target properties with
a lack of data. The effects of the dataset composition on model quality and the
applicability domain of the resulting models are also considered.
- Abstract(参考訳): 化学における機械学習の利用は一般的に行われている。
同時に、現代の機械学習手法の成功にもかかわらず、データの欠如は彼らの使用を制限する。
転送学習手法を使用することで、この問題が解決できる。
この方法論は、十分な量のデータに基づいて構築されたモデルが、訓練された化合物構造の一般的な特徴を捉え、データ不足でデータセット上でこれらの機能のさらなる再利用が、新しいモデルの品質を大幅に向上させると仮定する。
本稿では,グラフ畳み込みニューラルネットワークを用いた伝達学習を実現する,小さな有機分子に対するこのアプローチを開発した。
本論文は,データ不足を伴う対象特性のモデルの性能を著しく改善したことを示す。
また,データセット構成がモデル品質およびモデルの適用性ドメインに与える影響についても考察した。
関連論文リスト
- Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning [79.75718786477638]
我々は、それらを接続する物理法則が存在する分子的タスクの専門性を生かし、整合性トレーニングアプローチを設計する。
より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、構造予測を改善するために、力と非平衡構造データを直接活用できることがわかった。
論文 参考訳(メタデータ) (2024-10-14T03:11:33Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Calibration and generalizability of probabilistic models on low-data
chemical datasets with DIONYSUS [0.0]
我々は、小さな化学データセット上での確率論的機械学習モデルの校正と一般化可能性について広範な研究を行う。
私たちは、さまざまなタスク(バイナリ、回帰)とデータセットにおける予測と不確実性の品質を分析します。
我々は、新しい化学実験において一般的なシナリオである、小さな化学データセットをモデル化するためのモデルと特徴の選択に関する実践的な洞察を提供する。
論文 参考訳(メタデータ) (2022-12-03T08:19:06Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - A Physics-Guided Neural Operator Learning Approach to Model Biological
Tissues from Digital Image Correlation Measurements [3.65211252467094]
本稿では, 生体組織モデリングにおけるデータ駆動型相関について述べる。これは, 未知の負荷シナリオ下でのデジタル画像相関(DIC)測定に基づいて変位場を予測することを目的としている。
ブタ三尖弁リーフレット上の多軸延伸プロトコルのDIC変位追跡測定から材料データベースを構築した。
材料応答は、負荷から結果の変位場への解演算子としてモデル化され、材料特性はデータから暗黙的に学習され、自然にネットワークパラメータに埋め込まれる。
論文 参考訳(メタデータ) (2022-04-01T04:56:41Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Exploring the potential of transfer learning for metamodels of
heterogeneous material deformation [0.0]
転送学習は,低忠実度シミュレーションデータとシミュレーションデータの両方を利用することができることを示す。
我々は、大きな変形を受ける異種材料のオープンソースベンチマークデータセットであるMechanical MNISTを拡張した。
これらの低忠実度シミュレーション結果に基づいて学習したメタモデルに蓄積された知識の伝達は、高忠実度シミュレーションの結果を予測するのに使用されるメタモデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2020-10-28T12:43:46Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - BERT Learns (and Teaches) Chemistry [5.653789128055942]
そこで本研究では,データ駆動の観点から,機能基および他の特性に影響を及ぼす分子サブ構造の研究に注意を払わせることを提案する。
次に, モデルで学習した官能基と原子の表現を適用し, 毒性, 溶解度, 薬物類似性, アクセシビリティの問題に対処する。
論文 参考訳(メタデータ) (2020-07-11T00:23:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。