論文の概要: Context-enriched molecule representations improve few-shot drug
discovery
- arxiv url: http://arxiv.org/abs/2305.09481v1
- Date: Mon, 24 Apr 2023 17:58:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-21 10:53:46.134109
- Title: Context-enriched molecule representations improve few-shot drug
discovery
- Title(参考訳): コンテクストエンリッチな分子表現は、少量の薬物発見を改善する
- Authors: Johannes Schimunek, Philipp Seidl, Lukas Friedrich, Daniel Kuhn,
Friedrich Rippmann, Sepp Hochreiter, and G\"unter Klambauer
- Abstract要約: 数発の薬物発見のための新しい方法を提案する。
私たちの基本的な考え方は、既知のコンテキストや参照分子に関する知識によって分子表現を豊かにすることです。
本手法は,FS-Molベンチマークデータセットにおいて,薬物発見のためのいくつかの方法と比較した。
- 参考スコア(独自算出の注目度): 8.379853456273674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A central task in computational drug discovery is to construct models from
known active molecules to find further promising molecules for subsequent
screening. However, typically only very few active molecules are known.
Therefore, few-shot learning methods have the potential to improve the
effectiveness of this critical phase of the drug discovery process. We
introduce a new method for few-shot drug discovery. Its main idea is to enrich
a molecule representation by knowledge about known context or reference
molecules. Our novel concept for molecule representation enrichment is to
associate molecules from both the support set and the query set with a large
set of reference (context) molecules through a Modern Hopfield Network.
Intuitively, this enrichment step is analogous to a human expert who would
associate a given molecule with familiar molecules whose properties are known.
The enrichment step reinforces and amplifies the covariance structure of the
data, while simultaneously removing spurious correlations arising from the
decoration of molecules. Our approach is compared with other few-shot methods
for drug discovery on the FS-Mol benchmark dataset. On FS-Mol, our approach
outperforms all compared methods and therefore sets a new state-of-the art for
few-shot learning in drug discovery. An ablation study shows that the
enrichment step of our method is the key to improve the predictive quality. In
a domain shift experiment, we further demonstrate the robustness of our method.
Code is available at https://github.com/ml-jku/MHNfs.
- Abstract(参考訳): 計算薬物発見における中心的な課題は、既知の活性分子からモデルを構築し、その後のスクリーニングのためにさらに有望な分子を見つけることである。
しかし、通常、活性分子はほとんど知られていない。
したがって, 創薬過程におけるこの臨界相の有効性を, 数少ない学習方法が改善する可能性が示唆された。
数発の薬物発見のための新しい方法を提案する。
その主な考え方は、既知の文脈や参照分子に関する知識によって分子の表現を強化することである。
分子表現エンリッチメントの新たな概念は、サポートセットとクエリセットの両方の分子をモダンホップフィールドネットワークを通じて参照(コンテキスト)分子の集合に関連付けることである。
直感的には、この濃縮段階は、特定の分子と、その性質が知られている親しみやすい分子を関連付ける人間の専門家に類似している。
エンリッチメントステップは、データの共分散構造を強化し、増幅するとともに、分子の装飾から生じるスプリアス相関も同時に除去する。
この手法はfs-molベンチマークデータセット上での薬物発見のための他の数少ない手法と比較される。
fs-molでは,提案手法は比較法を上回っており,創薬における新技術が確立されている。
アブレーション研究により,本手法の富化ステップが予測品質向上の鍵であることが示唆された。
ドメインシフト実験では,提案手法の堅牢性をさらに実証する。
コードはhttps://github.com/ml-jku/mhnfsで入手できる。
関連論文リスト
- Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z) - Multi-Modal Representation Learning for Molecular Property Prediction:
Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。
本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。
モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文 参考訳(メタデータ) (2024-01-07T02:18:00Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Graph-based Molecular Representation Learning [59.06193431883431]
分子表現学習(MRL)は、機械学習と化学科学を結びつけるための重要なステップである。
近年、MRLは、特に深層分子グラフ学習に基づく手法において、かなりの進歩を遂げている。
論文 参考訳(メタデータ) (2022-07-08T17:43:20Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - Goal directed molecule generation using Monte Carlo Tree Search [15.462930062711237]
我々は,モンテカルロ木探索を用いて,各ステップで分子を単位変化させることにより分子生成を行う,ユニットMCTSと呼ばれる新しい手法を提案する。
本手法は,最近発表されたQEDやopalized logPといったベンチマーク分子最適化の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-30T17:49:59Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。