論文の概要: Advancing Ligand-based Virtual Screening and Molecular Generation with Pretrained Molecular Embedding Distance
- arxiv url: http://arxiv.org/abs/2604.24474v1
- Date: Mon, 27 Apr 2026 13:43:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:08.054459
- Title: Advancing Ligand-based Virtual Screening and Molecular Generation with Pretrained Molecular Embedding Distance
- Title(参考訳): 分子埋め込み距離を制限したリガンドを用いた仮想スクリーニングと分子生成
- Authors: Shiyun Wa, Yifei Wang, Simone Sciabola, Ye Wang,
- Abstract要約: 本研究では,タスク固有のトレーニングを伴わずに,事前学習された分子モデルから直接計算する,効果的な代替手段として,事前学習された埋め込み距離(PED)を提案する。
PEDは従来の類似度指標と異なる相関を示し、仮想スクリーニングと報酬設計による分子生成の導出の両方で効果的に機能する。
これらの結果は、事前訓練された分子埋め込みが豊富な構造情報を取り込み、近代的なAI支援薬物発見のための有望でスケーラブルな類似度測定に役立てることができることを示唆している。
- 参考スコア(独自算出の注目度): 11.302678902315725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular similarity plays a central role in ligand-based drug discovery, such as virtual screening, analog searching, and goal-directed molecular generation. However, traditional similarity measures, ranging from fingerprint-based Tanimoto coefficients to 3D shape overlays, are often computationally expensive at scale or rely on hand-crafted molecular descriptors. Meanwhile, many deep learning approaches to similarity-aware design still depend on similarity-specific supervision or costly data curation, limiting their generality across targets. In this work, we propose pretrained embedding distance (PED) as an effective alternative, computed directly from pretrained molecular models without task-specific training. Experimental results show that PED exhibits distinct correlations with traditional similarity metrics, and performs effectively in both ranking molecules for virtual screening and guiding molecular generation via reward design. These findings suggest that pretrained molecular embeddings capture rich structural information and can serve as a promising and scalable similarity measurement for modern AI-aided drug discovery.
- Abstract(参考訳): 分子類似性は、仮想スクリーニング、アナログ探索、ゴール指向分子生成などのリガンドに基づく薬物発見において中心的な役割を果たす。
しかし、指紋に基づく谷本係数から3次元形状オーバーレイまで、伝統的な類似性尺度は、しばしば大規模に計算コストがかかるか、手作りの分子ディスクリプタに依存している。
一方、類似性を考慮した設計に対する多くのディープラーニングアプローチは、いまだに類似性に特化した監督やコストのかかるデータキュレーションに依存しており、ターゲット間の一般性を制限している。
本研究では, タスク固有の訓練を伴わずに, 事前学習された分子モデルから直接計算した, 効果的な代替手段として, PED(Pretrained Embedding distance)を提案する。
実験の結果,PEDは従来の類似度指標と異なる相関を示し,仮想スクリーニングと報酬設計による分子生成の導出に有効であることがわかった。
これらの結果は、事前訓練された分子埋め込みが豊富な構造情報を取り込み、近代的なAI支援薬物発見のための有望でスケーラブルな類似度測定に役立てることができることを示唆している。
関連論文リスト
- Similarity-Quantized Relative Difference Learning for Improved Molecular Activity Prediction [0.0]
分子活性予測を構造的に類似した化合物の相対差学習として再構成する学習フレームワークであるSQRLを導入する。
我々は、パブリックデータセットとプロプライエタリな業界データにベンチマークすることで、その幅広い適用性と現実世界の可能性を示します。
論文 参考訳(メタデータ) (2025-01-15T19:42:18Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - Multi-channel learning for integrating structural hierarchies into context-dependent molecular representation [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - A biologically-inspired evaluation of molecular generative machine
learning [17.623886600638716]
分子生成モデル評価のためのバイオインスパイアされた新しいベンチマークを提案する。
本稿では, 創出出力評価のための相補的手法として, レクリエーション指標, 薬物-標的親和性予測, 分子ドッキングを提案する。
論文 参考訳(メタデータ) (2022-08-20T11:01:10Z) - Using Molecular Embeddings in QSAR Modeling: Does it Make a Difference? [0.6299766708197883]
分子埋め込み法に関する文献をレビューし, 分子埋め込み法を3つ, 分子埋め込み法を2つ再現した。
異なる分類と回帰データセットを用いたQSARシナリオにおけるこれらの性能に関する5つの手法を比較した。
本研究は, 薬物設計作業に使用する前に, 各種埋め込み技術について, 慎重に比較, 分析することの必要性を強調した。
論文 参考訳(メタデータ) (2021-03-20T21:45:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。