論文の概要: Harnessing Simulation for Molecular Embeddings
- arxiv url: http://arxiv.org/abs/2302.02055v1
- Date: Sat, 4 Feb 2023 01:32:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 20:32:31.576451
- Title: Harnessing Simulation for Molecular Embeddings
- Title(参考訳): 分子エンベディングのハーネス化シミュレーション
- Authors: Christopher Fifty, Joseph M. Paggi, Ehsan Amid, Jure Leskovec, Ron
Dror
- Abstract要約: 我々は物理に基づく分子シミュレーションを利用して分子埋め込みを開発する。
グラフニューラルネットワークをシミュレーションデータに適合させることで、シミュレーション中の生物学的ターゲットとの類似した相互作用を示す分子は、埋め込み空間において同様の表現を発達させる。
これらの埋め込みは、実世界のデータに基づいて訓練された下流モデルの特徴空間を初期化し、シミュレーション中に学んだ情報を分子予測タスクにエンコードするために使われる。
- 参考スコア(独自算出の注目度): 54.93553949058172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While deep learning has unlocked advances in computational biology once
thought to be decades away, extending deep learning techniques to the molecular
domain has proven challenging, as labeled data is scarce and the benefit from
self-supervised learning can be negligible in many cases. In this work, we
explore a different approach. Inspired by methods in deep reinforcement
learning and robotics, we explore harnessing physics-based molecular simulation
to develop molecular embeddings. By fitting a Graph Neural Network to
simulation data, molecules that display similar interactions with biological
targets under simulation develop similar representations in the embedding
space. These embeddings can then be used to initialize the feature space of
down-stream models trained on real-world data to encode information learned
during simulation into a molecular prediction task. Our experimental findings
indicate this approach improves the performance of existing deep learning
models on real-world molecular prediction tasks by as much as 38% with minimal
modification to the downstream model and no hyperparameter tuning.
- Abstract(参考訳): 深層学習は、何十年にもわたって計算生物学の進歩を解き放ったが、ラベル付きデータが乏しく、自己教師付き学習の利点が無視できるため、深層学習の技法を分子領域に拡張することは困難であることが証明されている。
この研究では、異なるアプローチを探求します。
深層強化学習とロボット工学の手法に着想を得て,分子組込みの開発に物理に基づく分子シミュレーションを応用した。
グラフニューラルネットワークをシミュレーションデータに適合させることで、シミュレーション中の生物学的ターゲットと同じような相互作用を示す分子が埋め込み空間で同様の表現を発達させる。
これらの埋め込みは、現実世界のデータに基づいて訓練された下流モデルの特徴空間を初期化して、シミュレーション中に学んだ情報を分子予測タスクにエンコードする。
実験結果から,本手法は実世界の分子予測タスクにおける既存のディープラーニングモデルの性能を,下流モデルに最小限の修正を加えて38%向上させ,ハイパーパラメータチューニングを不要とした。
関連論文リスト
- MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。
本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。
モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文 参考訳(メタデータ) (2024-01-07T02:18:00Z) - From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Do Large Scale Molecular Language Representations Capture Important
Structural Information? [31.76876206167457]
本稿では,MoLFormerと呼ばれる効率的なトランスフォーマーエンコーダモデルのトレーニングにより得られた分子埋め込みについて述べる。
実験の結果,グラフベースおよび指紋ベースによる教師付き学習ベースラインと比較して,学習された分子表現が競合的に機能することが確認された。
論文 参考訳(メタデータ) (2021-06-17T14:33:55Z) - Flexible dual-branched message passing neural network for quantum
mechanical property prediction with molecular conformation [16.08677447593939]
メッセージパッシングフレームワークに基づく分子特性予測のための二重分岐ニューラルネットワークを提案する。
本モデルでは,様々なスケールで異種分子の特徴を学習し,予測対象に応じて柔軟に学習する。
論文 参考訳(メタデータ) (2021-06-14T10:00:39Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。