論文の概要: Otter-Knowledge: benchmarks of multimodal knowledge graph representation
learning from different sources for drug discovery
- arxiv url: http://arxiv.org/abs/2306.12802v3
- Date: Thu, 19 Oct 2023 18:15:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 03:33:16.871263
- Title: Otter-Knowledge: benchmarks of multimodal knowledge graph representation
learning from different sources for drug discovery
- Title(参考訳): Otter-Knowledge:薬物発見のための異なるソースから学習したマルチモーダル知識グラフのベンチマーク
- Authors: Hoang Thanh Lam, Marco Luca Sbodio, Marcos Mart\'inez Galindo,
Mykhaylo Zayats, Ra\'ul Fern\'andez-D\'iaz, V\'ictor Valls, Gabriele Picco,
Cesar Berrospi Ramis, Vanessa L\'opez
- Abstract要約: マルチモーダルな知識グラフのセットをリリースし、7つの公開データソースからのデータを統合し、3000万以上のトリプルを含む。
我々の目的は、マルチモーダルな知識によってタンパク質/分子の埋め込みが予測タスクをどのように改善するかを研究するために、さらなる研究を促進することである。
- 参考スコア(独自算出の注目度): 5.913390277336069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent research on predicting the binding affinity between drug molecules and
proteins use representations learned, through unsupervised learning techniques,
from large databases of molecule SMILES and protein sequences. While these
representations have significantly enhanced the predictions, they are usually
based on a limited set of modalities, and they do not exploit available
knowledge about existing relations among molecules and proteins. In this study,
we demonstrate that by incorporating knowledge graphs from diverse sources and
modalities into the sequences or SMILES representation, we can further enrich
the representation and achieve state-of-the-art results for drug-target binding
affinity prediction in the established Therapeutic Data Commons (TDC)
benchmarks. We release a set of multimodal knowledge graphs, integrating data
from seven public data sources, and containing over 30 million triples. Our
intention is to foster additional research to explore how multimodal knowledge
enhanced protein/molecule embeddings can improve prediction tasks, including
prediction of binding affinity. We also release some pretrained models learned
from our multimodal knowledge graphs, along with source code for running
standard benchmark tasks for prediction of biding affinity.
- Abstract(参考訳): 薬物分子とタンパク質の結合親和性を予測するための最近の研究は、SMILESとタンパク質配列の大規模データベースから、教師なし学習技術を通じて学習した表現を用いている。
これらの表現は予測を著しく強化しているが、通常は限定的なモダリティに基づいており、分子やタンパク質間の既存の関係についての知識を利用できない。
本研究では,多種多様なソースやモダリティの知識グラフをシーケンスやスマイル表現に組み込むことにより,確立された治療データコモンズ(tdc)ベンチマークにおいて,薬物標的結合親和性予測のための表現をさらに豊かにし,最先端の結果が得られることを示す。
マルチモーダルな知識グラフを公開し、7つの公開データソースからのデータを統合し、3000万以上のトリプルを含む。
本研究の目的は,タンパク質/分子埋め込みのマルチモーダル知識が,結合親和性の予測を含む予測タスクをいかに改善できるかを検討するための追加研究を促進することである。
また、当社のマルチモーダルナレッジグラフから学んだ事前学習モデルと、入札アフィニティ予測のための標準ベンチマークタスクを実行するためのソースコードもリリースしています。
関連論文リスト
- Representation-Enhanced Neural Knowledge Integration with Application to Large-Scale Medical Ontology Learning [3.010503480024405]
本稿では,関係型の同時学習を実現するため,理論的に保証されたRENKIという統計フレームワークを提案する。
提案フレームワークは,表現学習出力をニューラルネットワークの初期エンティティ埋め込みに組み込んで,知識グラフのスコア関数を近似する。
ヘテロジニアス関係の存在下での重み付けの効果と、非パラメトリックモデルに表現学習を組み込むことの利点を実証する。
論文 参考訳(メタデータ) (2024-10-09T21:38:48Z) - MKDTI: Predicting drug-target interactions via multiple kernel fusion on graph attention network [37.40418564922425]
グラフアテンションネットワークの様々な層埋め込みからカーネル情報を抽出することにより、MKDTIと呼ばれるモデルを定式化する。
我々は、Dual Laplacian Regularized Least Squaresフレームワークを使用して、新規なドラッグターゲットエンティティ接続を予測する。
論文 参考訳(メタデータ) (2024-07-14T02:53:25Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule
Representations [55.42602325017405]
本稿では,分子の2レベル構造を考慮した新しいGODE法を提案する。
異なるグラフ構造上で2つのグラフニューラルネットワーク(GNN)を事前訓練し、対照的な学習と組み合わせることで、GODEは分子構造を対応する知識グラフサブ構造と融合させる。
11の化学特性タスクを微調整した場合、我々のモデルは既存のベンチマークよりも優れており、分類タスクの平均ROC-AUCアップリフトは13.8%、回帰タスクの平均RMSE/MAEエンハンスメントは35.1%である。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Multi-modal Graph Learning for Disease Prediction [35.4310911850558]
病気予測のためのエンドツーエンドのマルチモーダルグラフ学習フレームワーク(MMGL)を提案する。
隣接行列を既存の手法として手動で定義する代わりに、潜在グラフ構造を適応グラフ学習の新しい方法によって捉えることができる。
論文 参考訳(メタデータ) (2021-07-01T03:59:22Z) - Exploring the Limits of Few-Shot Link Prediction in Knowledge Graphs [49.6661602019124]
数発のリンク予測を行うため,本手法の現況を一般化したモデルスペクトルについて検討する。
単純なゼロショットベースライン – 関係性固有の情報を無視する – が驚くほど高いパフォーマンスを実現しているのが分かります。
慎重に構築された合成データセットの実験では、関係の例がいくつかあるだけで、モデルがきめ細かな構造情報を使用するのを基本的に制限することが示されている。
論文 参考訳(メタデータ) (2021-02-05T21:04:31Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。