論文の概要: A biologically-inspired evaluation of molecular generative machine
learning
- arxiv url: http://arxiv.org/abs/2208.09658v1
- Date: Sat, 20 Aug 2022 11:01:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 12:49:19.551604
- Title: A biologically-inspired evaluation of molecular generative machine
learning
- Title(参考訳): 生物学的に着想を得た分子生成機械学習の評価
- Authors: Elizaveta Vinogradova, Abay Artykbayev, Alisher Amanatay, Mukhamejan
Karatayev, Maxim Mametkulov, Albina Li, Anuar Suleimenov, Abylay Salimzhanov,
Karina Pats, Rustam Zhumagambetov, Ferdinand Moln\'ar, Vsevolod Peshkov,
Siamac Fazli
- Abstract要約: 分子生成モデル評価のためのバイオインスパイアされた新しいベンチマークを提案する。
本稿では, 創出出力評価のための相補的手法として, レクリエーション指標, 薬物-標的親和性予測, 分子ドッキングを提案する。
- 参考スコア(独自算出の注目度): 17.623886600638716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While generative models have recently become ubiquitous in many scientific
areas, less attention has been paid to their evaluation. For molecular
generative models, the state-of-the-art examines their output in isolation or
in relation to its input. However, their biological and functional properties,
such as ligand-target interaction is not being addressed. In this study, a
novel biologically-inspired benchmark for the evaluation of molecular
generative models is proposed. Specifically, three diverse reference datasets
are designed and a set of metrics are introduced which are directly relevant to
the drug discovery process. In particular we propose a recreation metric, apply
drug-target affinity prediction and molecular docking as complementary
techniques for the evaluation of generative outputs. While all three metrics
show consistent results across the tested generative models, a more detailed
comparison of drug-target affinity binding and molecular docking scores
revealed that unimodal predictiors can lead to erroneous conclusions about
target binding on a molecular level and a multi-modal approach is thus
preferrable. The key advantage of this framework is that it incorporates prior
physico-chemical domain knowledge into the benchmarking process by focusing
explicitly on ligand-target interactions and thus creating a highly efficient
tool not only for evaluating molecular generative outputs in particular, but
also for enriching the drug discovery process in general.
- Abstract(参考訳): 近年,多くの科学分野において生成モデルが普及しているが,その評価にはあまり注意が払われていない。
分子生成モデルでは、最先端技術はその出力を独立に、またはその入力に関して調べる。
しかし、リガンド-標的相互作用などの生物学的・機能的な性質は解決されていない。
本研究では,分子生成モデル評価のための生物学的指標を提案する。
具体的には、3つの多様な参照データセットが設計され、薬物発見プロセスに直接関係するメトリクスのセットが導入される。
特に, 創出出力評価のための相補的手法として, 医薬品親和性予測と分子ドッキングを適用したレクリエーション指標を提案する。
いずれの指標も、試験された生成モデル全体で一貫した結果を示す一方で、薬物-標的親和性結合と分子ドッキングスコアのより詳細な比較により、分子レベルでの標的結合に関する誤った結論を導出し、マルチモーダルアプローチが好ましいことが判明した。
このフレームワークの鍵となる利点は、リガンドとターゲットの相互作用に明示的に焦点を合わせ、特に分子生成出力を評価するだけでなく、一般に薬物発見プロセスの強化にも高効率なツールを作成することにより、以前の物理化学的ドメイン知識をベンチマークプロセスに組み込むことである。
関連論文リスト
- Aligning Target-Aware Molecule Diffusion Models with Exact Energy Optimization [147.7899503829411]
AliDiffは、事前訓練されたターゲット拡散モデルと望ましい機能特性を整合させる新しいフレームワークである。
最先端の結合エネルギーを持つ分子を最大7.07 Avg. Vina Scoreで生成することができる。
論文 参考訳(メタデータ) (2024-07-01T06:10:29Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - TAGMol: Target-Aware Gradient-guided Molecule Generation [19.977071499171903]
3次元生成モデルは、構造ベースドラッグデザイン(SBDD)において大きな可能性を秘めている。
問題を分子生成と特性予測に分離する。
後者は相乗的に拡散サンプリング過程を導出し、誘導拡散を促進し、所望の性質を持つ有意義な分子を創出する。
この誘導分子生成過程をTAGMolと呼ぶ。
論文 参考訳(メタデータ) (2024-06-03T14:43:54Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Target-aware Molecular Graph Generation [37.937378787812264]
そこで我々は,SiamFlowを提案する。これはフローが潜在空間内のターゲットシーケンス埋め込みの分布に適合するように強制する。
具体的には、アライメント損失と一様損失を用いて、ターゲットシーケンスの埋め込みと薬物グラフの埋め込みを合意に導く。
実験により,提案手法は,分子グラフ生成に向けた潜在空間における有意な表現を定量的に学習することを示す。
論文 参考訳(メタデータ) (2022-02-10T04:31:14Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z) - Analysis of training and seed bias in small molecules generated with a
conditional graph-based variational autoencoder -- Insights for practical
AI-driven molecule generation [0.0]
活性条件付きグラフベース変分オートエンコーダ(VAE)の出力に及ぼすシードとトレーニングバイアスの影響を解析する。
グラフに基づく生成モデルは, 所望の条件付き活性と, 生成分子における好ましくない物理特性の創出に優れていた。
論文 参考訳(メタデータ) (2021-07-19T16:00:05Z) - Multi-View Self-Attention for Interpretable Drug-Target Interaction
Prediction [4.307720252429733]
機械学習のアプローチでは、分子の数値表現がモデルの性能に欠かせない。
薬物と標的の相互作用をモデル化するための自己注意に基づく多視点表現学習手法を提案する。
論文 参考訳(メタデータ) (2020-05-01T14:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。