論文の概要: Scaffold-Aware Generative Augmentation and Reranking for Enhanced Virtual Screening
- arxiv url: http://arxiv.org/abs/2510.16306v1
- Date: Sat, 18 Oct 2025 02:26:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.937792
- Title: Scaffold-Aware Generative Augmentation and Reranking for Enhanced Virtual Screening
- Title(参考訳): 仮想スクリーニング機能強化のためのスキャフォールド・アウェア・ジェネレーティブ・オービメンテーションとリライジング
- Authors: Xin Wang, Yu Wang, Yunchao Liu, Jens Meiler, Tyler Derr,
- Abstract要約: リガンドベースの仮想スクリーニング(VS)は、薬物発見の重要なステップである。
VSは、低い活性率によるクラス不均衡、特定の足場が支配する活性分子間の構造不均衡、構造的に多様な活性化合物を同定する必要性の3つの大きな課題に直面している。
SaffAugはスキャフォールド対応のVSフレームワークで、3つのモジュールを通じてこれらの課題に対処する。
- 参考スコア(独自算出の注目度): 16.751838234028515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ligand-based virtual screening (VS) is an essential step in drug discovery that evaluates large chemical libraries to identify compounds that potentially bind to a therapeutic target. However, VS faces three major challenges: class imbalance due to the low active rate, structural imbalance among active molecules where certain scaffolds dominate, and the need to identify structurally diverse active compounds for novel drug development. We introduce ScaffAug, a scaffold-aware VS framework that addresses these challenges through three modules. The augmentation module first generates synthetic data conditioned on scaffolds of actual hits using generative AI, specifically a graph diffusion model. This helps mitigate the class imbalance and furthermore the structural imbalance, due to our proposed scaffold-aware sampling algorithm, designed to produce more samples for active molecules with underrepresented scaffolds. A model-agnostic self-training module is then used to safely integrate the generated synthetic data from our augmentation module with the original labeled data. Lastly, we introduce a reranking module that improves VS by enhancing scaffold diversity in the top recommended set of molecules, while still maintaining and even enhancing the overall general performance of identifying novel, active compounds. We conduct comprehensive computational experiments across five target classes, comparing ScaffAug against existing baseline methods by reporting the performance of multiple evaluation metrics and performing ablation studies on ScaffAug. Overall, this work introduces novel perspectives on effectively enhancing VS by leveraging generative augmentations, reranking, and general scaffold-awareness.
- Abstract(参考訳): Ligand-based virtual screening (VS) は、治療標的に結合する可能性のある化合物を特定するために、大きな化学ライブラリーを評価する薬物発見の不可欠なステップである。
しかし、VSは、低活性率によるクラス不均衡、特定の足場が支配する活性分子間の構造不均衡、新規医薬品開発のための構造的に多様な活性化合物の同定の必要性の3つの大きな課題に直面している。
ScaffAugはスキャフォールド対応のVSフレームワークで、3つのモジュールを通じてこれらの課題に対処する。
拡張モジュールはまず、生成AI、特にグラフ拡散モデルを用いて、実際のヒットの足場に条件付き合成データを生成する。
これにより、クラス不均衡を緩和し、さらに構造不均衡を緩和することができる。これは、足場が不足している活性分子に対してより多くのサンプルを生成するために提案された足場対応サンプリングアルゴリズムによるものである。
次に、モデルに依存しない自己学習モジュールを用いて、拡張モジュールから生成された合成データを元のラベル付きデータと安全に統合する。
最後に, 新規な活性化合物の同定における全体的な性能を維持・向上しつつ, 最上位の推奨分子群における足場多様性を向上し, VS を改良するモジュールを提案する。
我々は,複数の評価指標の性能を報告し,ScaffAugに関するアブレーション研究を行うことにより,ScaffAugを既存のベースライン手法と比較する,5つのクラスにわたる総合的な計算実験を行った。
全体として、この研究は、生成的拡張、再ランク付け、一般的な足場認識を活用することで、VSを効果的に強化する新しい視点を導入している。
関連論文リスト
- CAME-AB: Cross-Modality Attention with Mixture-of-Experts for Antibody Binding Site Prediction [9.316793780511917]
bfCAME-ABは、抗体結合部位の予測のための新しいクロスモダリティアテンションフレームワークである。
生の酸コード、BLOSUM置換プロファイル、事前訓練された言語モデル埋め込み、構造認識機能、生化学グラフを統合している。
これは、Precision、Recall、F1スコア、AUC-ROC、MCCなど、複数のメトリクスの強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-09-08T09:24:09Z) - DecompDiff: Diffusion Models with Decomposed Priors for Structure-Based Drug Design [62.68420322996345]
既存の構造に基づく薬物設計法は、すべての配位子原子を等しく扱う。
腕と足場を分解した新しい拡散モデルDecompDiffを提案する。
提案手法は,高親和性分子の生成における最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-26T05:21:21Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Structure-based Drug Design with Equivariant Diffusion Models [40.73626627266543]
本稿では,タンパク質ポケットに新しい条件を付加したSE(3)-同変拡散モデルDiffSBDDを提案する。
我々のサイリコ実験では、DiffSBDDが地上の真実データの統計を効果的に捉えていることが示されています。
これらの結果は、拡散モデルが従来の方法よりも正確に構造データの複雑な分布を表すという仮定を支持する。
論文 参考訳(メタデータ) (2022-10-24T15:51:21Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Adversarial Feature Hallucination Networks for Few-Shot Learning [84.31660118264514]
Adversarial Feature Hallucination Networks (AFHN) は条件付き Wasserstein Generative Adversarial Network (cWGAN) に基づいている。
合成された特徴の識別性と多様性を促進するために、2つの新規レギュレータがAFHNに組み込まれている。
論文 参考訳(メタデータ) (2020-03-30T02:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。