論文の概要: SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction
- arxiv url: http://arxiv.org/abs/2206.09818v3
- Date: Tue, 17 Oct 2023 14:06:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 00:42:56.989927
- Title: SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction
- Title(参考訳): ssm-dta:薬物標的親和性予測におけるデータ不足の障壁を破る
- Authors: Qizhi Pei, Lijun Wu, Jinhua Zhu, Yingce Xia, Shufang Xie, Tao Qin,
Haiguang Liu, Tie-Yan Liu, Rui Yan
- Abstract要約: 薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
- 参考スコア(独自算出の注目度): 127.43571146741984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate prediction of Drug-Target Affinity (DTA) is of vital importance in
early-stage drug discovery, facilitating the identification of drugs that can
effectively interact with specific targets and regulate their activities. While
wet experiments remain the most reliable method, they are time-consuming and
resource-intensive, resulting in limited data availability that poses
challenges for deep learning approaches. Existing methods have primarily
focused on developing techniques based on the available DTA data, without
adequately addressing the data scarcity issue. To overcome this challenge, we
present the SSM-DTA framework, which incorporates three simple yet highly
effective strategies: (1) A multi-task training approach that combines DTA
prediction with masked language modeling (MLM) using paired drug-target data.
(2) A semi-supervised training method that leverages large-scale unpaired
molecules and proteins to enhance drug and target representations. This
approach differs from previous methods that only employed molecules or proteins
in pre-training. (3) The integration of a lightweight cross-attention module to
improve the interaction between drugs and targets, further enhancing prediction
accuracy. Through extensive experiments on benchmark datasets such as
BindingDB, DAVIS, and KIBA, we demonstrate the superior performance of our
framework. Additionally, we conduct case studies on specific drug-target
binding activities, virtual screening experiments, drug feature visualizations,
and real-world applications, all of which showcase the significant potential of
our work. In conclusion, our proposed SSM-DTA framework addresses the data
limitation challenge in DTA prediction and yields promising results, paving the
way for more efficient and accurate drug discovery processes. Our code is
available at $\href{https://github.com/QizhiPei/SSM-DTA}{Github}$.
- Abstract(参考訳): 薬物標的親和性(DTA)の正確な予測は、早期の薬物発見において極めて重要であり、特定の標的と効果的に相互作用し、それらの活性を調節する薬物の同定を容易にする。
ウェット実験は依然として最も信頼性の高い方法だが、時間的消費とリソース集約性によって、ディープラーニングアプローチの課題となるデータ可用性が制限される。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
この課題を克服するために,1)DTA予測とMLM(Masked Language Modeling)を併用したマルチタスクトレーニングアプローチと,組み合わせた薬物標的データを用いたSSM-DTAフレームワークを提案する。
2) 薬品および標的表現を増強するために, 大規模非ペア分子とタンパク質を活用する半教師付き訓練法。
このアプローチは、事前学習に分子やタンパク質のみを用いる従来の方法とは異なる。
3) 薬物と標的との相互作用を改善する軽量なクロスアテンションモジュールの統合により,予測精度が向上した。
BindingDB、DAVIS、KIBAといったベンチマークデータセットに関する広範な実験を通じて、我々のフレームワークの優れたパフォーマンスを実証する。
さらに, 特定の薬物標的結合活動, 仮想スクリーニング実験, 薬物特徴の可視化, 実世界の応用についてケーススタディを行い, いずれも研究の有意な可能性を示した。
結論として,提案するSSM-DTAフレームワークはDTA予測におけるデータ制限問題に対処し,より効率的かつ正確な薬物発見プロセスの道を開いた。
私たちのコードは$\href{https://github.com/QizhiPei/SSM-DTA}{Github}$で利用可能です。
関連論文リスト
- GramSeq-DTA: A grammar-based drug-target affinity prediction approach fusing gene expression information [1.2289361708127877]
薬物や標的の構造情報と化学摂動情報を統合するGramSeq-DTAを提案する。
我々の手法は、広く使われているDTAデータセットで検証された場合、現在の最先端のDTA予測モデルよりも優れている。
論文 参考訳(メタデータ) (2024-11-03T03:17:09Z) - SMILES-Mamba: Chemical Mamba Foundation Models for Drug ADMET Prediction [16.189335444981353]
小分子の薬物の吸収、分布、代謝、排出、毒性を予測することは安全性と有効性を確保するために重要である。
本稿では,ラベル付きデータとラベル付きデータの両方を活用する2段階モデルを提案する。
その結果,SMILES-Mambaは22のADMETデータセットの競合性能を示し,14のタスクで最高スコアを達成した。
論文 参考訳(メタデータ) (2024-08-11T04:53:12Z) - Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - A Cross-Field Fusion Strategy for Drug-Target Interaction Prediction [85.2792480737546]
既存の方法は、DTI予測中にグローバルなタンパク質情報を利用することができない。
ローカルおよびグローバルなタンパク質情報を取得するために、クロスフィールド情報融合戦略が採用されている。
SiamDTI予測法は、新規薬物や標的に対する他の最先端(SOTA)法よりも高い精度を達成する。
論文 参考訳(メタデータ) (2024-05-23T13:25:20Z) - DDIPrompt: Drug-Drug Interaction Event Prediction based on Graph Prompt Learning [15.69547371747469]
DDIPromptは、グラフプロンプト学習の最近の進歩に触発された革新的なソリューションである。
我々のフレームワークは、事前訓練されたモデルから本質的な知識を活用することで、これらの問題に対処することを目的としている。
2つのベンチマークデータセットに対する大規模な実験は、DDIPromptのSOTAパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-18T06:22:01Z) - PGraphDTA: Improving Drug Target Interaction Prediction using Protein
Language Models and Contact Maps [4.590060921188914]
薬物発見の鍵となる側面は、新規な薬物標的相互作用(DT)の同定である。
タンパク質-リガンド相互作用は結合親和性として知られる結合強度の連続性を示す。
性能向上のための新しい改良を提案する。
論文 参考訳(メタデータ) (2023-10-06T05:00:25Z) - Zero-shot Learning of Drug Response Prediction for Preclinical Drug
Screening [38.94493676651818]
ゼロショット学習ソリューションを提案する。
予防的薬物スクリーニングの課題です
具体的には、MSDAと呼ばれるマルチブランチマルチソースドメイン適応テスト拡張プラグインを提案する。
論文 参考訳(メタデータ) (2023-10-05T05:55:41Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Multi-View Substructure Learning for Drug-Drug Interaction Prediction [69.34322811160912]
DDI予測のための新しいマルチビュードラッグサブ構造ネットワーク(MSN-DDI)を提案する。
MSN-DDIは、単一の薬物(イントラビュー)と薬物ペア(インタービュー)の両方の表現から化学的サブ構造を同時に学習し、そのサブ構造を利用して、薬物表現を反復的に更新する。
総合的な評価では、MSN-DDIは、トランスダクティブ・セッティングの下で比較的改善された19.32%と99%以上の精度を達成することで、既存の薬物に対するDDI予測をほぼ解決したことを示している。
論文 参考訳(メタデータ) (2022-03-28T05:44:29Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。