論文の概要: Contrastive Multi-Task Learning with Solvent-Aware Augmentation for Drug Discovery
- arxiv url: http://arxiv.org/abs/2508.01799v1
- Date: Sun, 03 Aug 2025 15:25:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.068273
- Title: Contrastive Multi-Task Learning with Solvent-Aware Augmentation for Drug Discovery
- Title(参考訳): 薬物発見のための溶媒を意識したマルチタスク学習
- Authors: Jing Lan, Hexiao Ding, Hongzhao Chen, Yufeng Jiang, Ng Nga Chun, Gerald W. Y. Cheng, Zongxi Li, Jing Cai, Liang-ting Lin, Jung Sun Yoo,
- Abstract要約: 各種溶媒条件下で生成する配位子コンフォメーションアンサンブルを付加入力として組み込んだ事前学習法を提案する。
トレーニングプロセスは、分子再構成を統合し、局所的な幾何学、原子間距離予測、および対照的な学習を捉え、溶媒不変の分子表現を構築する。
このフレームワークは、溶媒を意識したマルチタスクモデリングをサポートし、ベンチマーク間で一貫した結果を生成する。
- 参考スコア(独自算出の注目度): 3.229836697956724
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate prediction of protein-ligand interactions is essential for computer-aided drug discovery. However, existing methods often fail to capture solvent-dependent conformational changes and lack the ability to jointly learn multiple related tasks. To address these limitations, we introduce a pre-training method that incorporates ligand conformational ensembles generated under diverse solvent conditions as augmented input. This design enables the model to learn both structural flexibility and environmental context in a unified manner. The training process integrates molecular reconstruction to capture local geometry, interatomic distance prediction to model spatial relationships, and contrastive learning to build solvent-invariant molecular representations. Together, these components lead to significant improvements, including a 3.7% gain in binding affinity prediction, an 82% success rate on the PoseBusters Astex docking benchmarks, and an area under the curve of 97.1% in virtual screening. The framework supports solvent-aware, multi-task modeling and produces consistent results across benchmarks. A case study further demonstrates sub-angstrom docking accuracy with a root-mean-square deviation of 0.157 angstroms, offering atomic-level insight into binding mechanisms and advancing structure-based drug design.
- Abstract(参考訳): タンパク質-リガンド相互作用の正確な予測は、コンピュータ支援薬物発見に不可欠である。
しかし、既存の方法では溶媒依存のコンフォメーション変化を捉えることができず、複数の関連するタスクを共同で学習する能力に欠けることが多い。
これらの制約に対処するため,種々の溶媒条件下で生成した配位子コンフォメーションアンサンブルを付加入力として組み込んだ事前学習手法を導入する。
この設計により、モデルは構造的柔軟性と環境コンテキストを統一的に学習することができる。
トレーニングプロセスは、分子再構成を統合し、局所幾何学、原子間距離予測を捉え、空間関係をモデル化し、溶媒不変の分子表現を構築するために対照的な学習を行う。
これらのコンポーネントは、バインディング親和性予測の3.7%向上、PoseBusters Astexドッキングベンチマークの82%の成功率、仮想スクリーニングの97.1%以下の領域など、大幅な改善につながった。
このフレームワークは、溶媒を意識したマルチタスクモデリングをサポートし、ベンチマーク間で一貫した結果を生成する。
ケーススタディではさらに、0.157アングストロムのルート平均平方偏差によるサブアングストロムドッキングの精度を実証し、結合機構と構造に基づく薬物設計の進歩に関する原子レベル洞察を提供する。
関連論文リスト
- SphUnc: Hyperspherical Uncertainty Decomposition and Causal Identification via Information Geometry [7.816699755198432]
本稿では,超球面表現学習と構造因果モデリングを組み合わせた統合フレームワークであるSphUncを紹介する。
球状潜伏剤の構造因果モデルにより、サンプルベースシミュレーションによる直接的影響同定と介入推論が可能となる。
社会的および感情的なベンチマークに関する実証的な評価では、精度の向上、校正の改善、因果信号の解釈が示されている。
論文 参考訳(メタデータ) (2026-03-01T16:11:49Z) - Information Fidelity in Tool-Using LLM Agents: A Martingale Analysis of the Model Context Protocol [69.11739400975445]
モデルコンテキストプロトコル(MCP)エージェントにおけるエラー蓄積を解析するための最初の理論的枠組みを紹介する。
累積歪みが線形成長と高確率偏差を$O(sqrtT)$で表すことを示す。
主な発見は、意味重み付けは歪みを80%減らし、周期的再接地は、エラー制御の約9ステップごとに十分である。
論文 参考訳(メタデータ) (2026-02-10T21:08:53Z) - Edge-aware GAT-based protein binding site prediction [3.3941174310007685]
生体分子間の結合部位のきめ細かい予測のためのエッジ対応グラフ注意ネットワーク(Edge対応GAT)モデルを提案する。
本手法は原子レベルのグラフを構築し,幾何学的記述子を含む多次元構造特徴を統合する。
本モデルでは,タンパク質結合部位予測のためのROC-AUCの0.93を達成し,いくつかの最先端手法より優れている。
論文 参考訳(メタデータ) (2026-01-05T14:09:57Z) - Composable Score-based Graph Diffusion Model for Multi-Conditional Molecular Generation [85.58520120011269]
本研究では,具体的スコアを用いてスコアマッチングを離散グラフに拡張するComposable Score-based Graph Diffusion Model (CSGD)を提案する。
CSGDは従来の手法よりも平均15.3%の制御性向上を実現していることを示す。
本研究は, 離散グラフ生成におけるスコアベースモデリングの実用的利点と, フレキシブルでマルチプロパタイトな分子設計のためのキャパシティを強調した。
論文 参考訳(メタデータ) (2025-09-11T13:37:56Z) - A Contrastive Learning-Guided Confident Meta-learning for Zero Shot Anomaly Detection [17.73056562717683]
CoZADは、新しいゼロショット異常検出フレームワークである。
ソフト・インテリジェンス・ラーニングとメタラーニングとコントラスト的特徴表現を統合している。
7つの産業ベンチマークのうち6つで既存の手法を上回ります。
論文 参考訳(メタデータ) (2025-08-25T09:27:31Z) - Model Accuracy and Data Heterogeneity Shape Uncertainty Quantification in Machine Learning Interatomic Potentials [5.955636672018519]
機械学習原子間ポテンシャル(MLIP)は正確な原子モデルを可能にするが、信頼性のある不確実性定量化(UQ)はいまだ解明されていない。
本研究では,原子クラスター拡張フレームワーク内でのアンサンブル学習とD-最適性の2つのUQ戦略について検討する。
論文 参考訳(メタデータ) (2025-08-05T12:52:49Z) - Robust Molecular Property Prediction via Densifying Scarce Labeled Data [51.55434084913129]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では,未ラベルデータを利用したメタラーニングに基づく新しい手法を提案する。
実世界のデータセットに挑戦する上で、大きなパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Sequence-Only Prediction of Binding Affinity Changes: A Robust and Interpretable Model for Antibody Engineering [9.789817970737666]
抗体工学における研究の重要な領域は、抗体-抗原結合親和性を高める効果的な修飾を見つけることである。
ディープラーニングソリューションは、結合親和性の変化を予測するために抗体構造をモデル化する代替手段を提供する。
本稿では,抗体-抗原複合体の配列情報のみに基づいて結合親和性変化を予測する深層学習モデルProtAttBAを提案する。
論文 参考訳(メタデータ) (2025-05-14T15:00:46Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Manifold-Constrained Nucleus-Level Denoising Diffusion Model for Structure-Based Drug Design [81.95343363178662]
原子は分離違反を避けるために 最小の対距離を維持する必要がある
NucleusDiff は原子核と周囲の電子雲の間の相互作用を距離制約によってモデル化する。
違反率は1000%まで減少し、結合親和性は22.16%まで向上し、構造に基づく薬物設計の最先端モデルを上回る。
論文 参考訳(メタデータ) (2024-09-16T08:42:46Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Structured Radial Basis Function Network: Modelling Diversity for
Multiple Hypotheses Prediction [51.82628081279621]
多重モード回帰は非定常過程の予測や分布の複雑な混合において重要である。
構造的放射基底関数ネットワークは回帰問題に対する複数の仮説予測器のアンサンブルとして提示される。
この構造モデルにより, このテッセルレーションを効率よく補間し, 複数の仮説対象分布を近似することが可能であることが証明された。
論文 参考訳(メタデータ) (2023-09-02T01:27:53Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction with Graph-Based Deep Learning [40.83037811977803]
Dynaformerは、タンパク質-リガンド結合親和性を予測するために開発されたグラフベースのディープラーニングモデルである。
CASF-2016ベンチマークデータセットでは、最先端のスコアとランキングの能力を示している。
熱ショックタンパク質90(HSP90)の仮想スクリーニングにおいて、20の候補を同定し、それらの結合親和性を実験的に検証する。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - Extracting Chemical-Protein Interactions via Calibrated Deep Neural
Network and Self-training [0.8376091455761261]
データ不確実性を推定し、信頼性を向上させるため、ディープラーニングモデルに"校正"技術が適用されている。
本研究では, 化学物質-タンパク質相互作用を抽出するために, 不確実性情報とキャリブレーション手法を取り入れたDNNベースの手法を提案する。
我々の手法は,従来の手法よりも高い校正能力を維持しつつ,Biocreative VI ChemProtタスクに関して最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-11-04T10:14:31Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。