論文の概要: Valid Property-Enhanced Contrastive Learning for Targeted Optimization & Resampling for Novel Drug Design
- arxiv url: http://arxiv.org/abs/2509.00684v1
- Date: Sun, 31 Aug 2025 03:55:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.341211
- Title: Valid Property-Enhanced Contrastive Learning for Targeted Optimization & Resampling for Novel Drug Design
- Title(参考訳): 新規医薬品設計のための目標最適化と再サンプリングのための妥当性向上コントラスト学習
- Authors: Amartya Banerjee, Somnath Kar, Anirban Pal, Debabrata Maiti,
- Abstract要約: VECTOR+は、プロパティ誘導表現学習と制御可能な分子生成を結合するフレームワークである。
VECTOR+は新規で合成抽出可能な候補を生成する。
VECTOR+はキナーゼ阻害剤に一般化し、確立された薬物よりも強いドッキングスコアを持つ化合物を産生する。
- 参考スコア(独自算出の注目度): 1.4874449172133888
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficiently steering generative models toward pharmacologically relevant regions of chemical space remains a major obstacle in molecular drug discovery under low-data regimes. We present VECTOR+: Valid-property-Enhanced Contrastive Learning for Targeted Optimization and Resampling, a framework that couples property-guided representation learning with controllable molecule generation. VECTOR+ applies to both regression and classification tasks and enables interpretable, data-efficient exploration of functional chemical space. We evaluate on two datasets: a curated PD-L1 inhibitor set (296 compounds with experimental $IC_{50}$ values) and a receptor kinase inhibitor set (2,056 molecules by binding mode). Despite limited training data, VECTOR+ generates novel, synthetically tractable candidates. Against PD-L1 (PDB 5J89), 100 of 8,374 generated molecules surpass a docking threshold of $-15.0$ kcal/mol, with the best scoring $-17.6$ kcal/mol compared to the top reference inhibitor ($-15.4$ kcal/mol). The best-performing molecules retain the conserved biphenyl pharmacophore while introducing novel motifs. Molecular dynamics (250 ns) confirm binding stability (ligand RMSD < $2.5$ angstroms). VECTOR+ generalizes to kinase inhibitors, producing compounds with stronger docking scores than established drugs such as brigatinib and sorafenib. Benchmarking against JT-VAE and MolGPT across docking, novelty, uniqueness, and Tanimoto similarity highlights the superior performance of our method. These results position our work as a robust, extensible approach for property-conditioned molecular design in low-data settings, bridging contrastive learning and generative modeling for reproducible, AI-accelerated discovery.
- Abstract(参考訳): 化学空間の薬理学的関連領域に対する効率的な生成モデルの構築は、低データ状態下での分子ドラッグ発見において大きな障害となっている。
提案するVECTOR+: Valid-property-Enhanced Contrastive Learning for Targeted Optimization and Resamplingは、プロパティ誘導表現学習と制御可能な分子生成を結合するフレームワークである。
VECTOR+は回帰処理と分類処理の両方に適用され、機能化学空間の解釈可能でデータ効率の高い探索を可能にする。
PD-L1インヒビターセット(IC_{50}$値の296化合物)と受容体キナーゼインヒビターセット(2,056分子を結合モードで測定した。
限られた訓練データにもかかわらず、VECTOR+は新規で合成抽出可能な候補を生成する。
PD-L1 (PDB 5J89) に対して、8,374個の生成分子のうち100個はドッキング閾値が 15.0$ kcal/mol を超え、最も高い基準阻害剤 (-15.4$ kcal/mol) と比較すると-17.6$ kcal/mol である。
最高性能の分子は保存されたビフェニル製薬室を保ちながら、新規なモチーフを導入する。
分子動力学(250 ns)は結合安定性(リガンドRMSD <$2.5$ angstroms)を確認する。
VECTOR+はキナーゼ阻害剤に一般化し、ブリガチニブやソラフェニブのような確立された薬物よりも強いドッキングスコアを持つ化合物を産生する。
JT-VAE と MolGPT に対するドッキング,ノベルティ,ユニークさ,谷本類似性などのベンチマークにより,本手法の優れた性能が示された。
これらの結果は、我々の研究を、低データ設定における特性条件付き分子設計のための堅牢で拡張可能なアプローチ、再現可能なAI加速発見のためのコントラスト学習と生成モデルとして位置づけている。
関連論文リスト
- BAPULM: Binding Affinity Prediction using Language Models [7.136205674624813]
本稿では,ProtT5-XL-U50およびMollFormerを介してタンパク質の化学潜伏表現を利用する,革新的な配列ベースフレームワークであるBAPULMを紹介する。
提案手法は,ベンチマーク1k2101, Test2016_290, CSAR-HiQ_36でそれぞれ0.925 $pm$0.043, 0.914 $pm$0.004, 0.8132 $pm$0.0001のシーケンシャルスコアリングパワー(R)値を達成した。
論文 参考訳(メタデータ) (2024-11-06T04:35:30Z) - Manifold-Constrained Nucleus-Level Denoising Diffusion Model for Structure-Based Drug Design [81.95343363178662]
原子は分離違反を避けるために 最小の対距離を維持する必要がある
NucleusDiff は原子核と周囲の電子雲の間の相互作用を距離制約によってモデル化する。
違反率は1000%まで減少し、結合親和性は22.16%まで向上し、構造に基づく薬物設計の最先端モデルを上回る。
論文 参考訳(メタデータ) (2024-09-16T08:42:46Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Drug Repurposing Targeting COVID-19 3CL Protease using Molecular Docking and Machine Learning Regression Approach [0.15346678870160887]
新型コロナウイルス(COVID-19)のパンデミックが世界的な緊急事態を宣言。
SARS-CoV-2の主プロテアーゼ3CLを標的とした5903薬剤の阻害効果を検討した。
我々は、QSARモデリングに機械学習回帰手法を用いて、高い結合親和性を持つ潜在的な薬物を発見する。
論文 参考訳(メタデータ) (2023-05-25T05:34:39Z) - LIMO: Latent Inceptionism for Targeted Molecule Generation [14.391216237573369]
本研究は,分子発生を極めて促進する分子発生機構であるLIMO(Latent Inceptionism on Molecules)について述べる。
総合的な実験により、LIMOはベンチマークタスクで競争力を発揮することが示された。
生成した薬物様化合物の1つが、ヒトエストロゲン受容体に対して6~14ドルのK_D$を予測している。
論文 参考訳(メタデータ) (2022-06-17T21:05:58Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z) - Benchmarking Deep Graph Generative Models for Optimizing New Drug
Molecules for COVID-19 [11.853524110656991]
ターゲット特性を持つ新規薬物化合物の設計は、生成モデル研究の鍵となる分野である。
本稿では、グラフ生成モデルに基づく小さな薬物分子設計パイプラインと、新型コロナウイルスの標的薬物候補を設計するための2つの最先端グラフ生成モデルの比較研究について述べる。
論文 参考訳(メタデータ) (2021-02-09T17:49:26Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z) - CogMol: Target-Specific and Selective Drug Design for COVID-19 Using
Deep Generative Models [74.58583689523999]
新規なウイルスタンパク質を標的とした新規な薬物様小分子を設計するためのエンド・ツー・エンドのフレームワークであるCogMolを提案する。
CogMolは、分子SMILES変分オートエンコーダ(VAE)の適応事前学習と、効率的なマルチ属性制御サンプリングスキームを組み合わせる。
CogMolは、高目標特異性と選択性を有する合成可能で低毒性な薬物様分子の多制約設計を扱う。
論文 参考訳(メタデータ) (2020-04-02T18:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。