論文の概要: Otter-Knowledge: benchmarks of multimodal knowledge graph representation
learning from different sources for drug discovery
- arxiv url: http://arxiv.org/abs/2306.12802v3
- Date: Thu, 19 Oct 2023 18:15:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 03:33:16.871263
- Title: Otter-Knowledge: benchmarks of multimodal knowledge graph representation
learning from different sources for drug discovery
- Title(参考訳): Otter-Knowledge:薬物発見のための異なるソースから学習したマルチモーダル知識グラフのベンチマーク
- Authors: Hoang Thanh Lam, Marco Luca Sbodio, Marcos Mart\'inez Galindo,
Mykhaylo Zayats, Ra\'ul Fern\'andez-D\'iaz, V\'ictor Valls, Gabriele Picco,
Cesar Berrospi Ramis, Vanessa L\'opez
- Abstract要約: マルチモーダルな知識グラフのセットをリリースし、7つの公開データソースからのデータを統合し、3000万以上のトリプルを含む。
我々の目的は、マルチモーダルな知識によってタンパク質/分子の埋め込みが予測タスクをどのように改善するかを研究するために、さらなる研究を促進することである。
- 参考スコア(独自算出の注目度): 5.913390277336069
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent research on predicting the binding affinity between drug molecules and
proteins use representations learned, through unsupervised learning techniques,
from large databases of molecule SMILES and protein sequences. While these
representations have significantly enhanced the predictions, they are usually
based on a limited set of modalities, and they do not exploit available
knowledge about existing relations among molecules and proteins. In this study,
we demonstrate that by incorporating knowledge graphs from diverse sources and
modalities into the sequences or SMILES representation, we can further enrich
the representation and achieve state-of-the-art results for drug-target binding
affinity prediction in the established Therapeutic Data Commons (TDC)
benchmarks. We release a set of multimodal knowledge graphs, integrating data
from seven public data sources, and containing over 30 million triples. Our
intention is to foster additional research to explore how multimodal knowledge
enhanced protein/molecule embeddings can improve prediction tasks, including
prediction of binding affinity. We also release some pretrained models learned
from our multimodal knowledge graphs, along with source code for running
standard benchmark tasks for prediction of biding affinity.
- Abstract(参考訳): 薬物分子とタンパク質の結合親和性を予測するための最近の研究は、SMILESとタンパク質配列の大規模データベースから、教師なし学習技術を通じて学習した表現を用いている。
これらの表現は予測を著しく強化しているが、通常は限定的なモダリティに基づいており、分子やタンパク質間の既存の関係についての知識を利用できない。
本研究では,多種多様なソースやモダリティの知識グラフをシーケンスやスマイル表現に組み込むことにより,確立された治療データコモンズ(tdc)ベンチマークにおいて,薬物標的結合親和性予測のための表現をさらに豊かにし,最先端の結果が得られることを示す。
マルチモーダルな知識グラフを公開し、7つの公開データソースからのデータを統合し、3000万以上のトリプルを含む。
本研究の目的は,タンパク質/分子埋め込みのマルチモーダル知識が,結合親和性の予測を含む予測タスクをいかに改善できるかを検討するための追加研究を促進することである。
また、当社のマルチモーダルナレッジグラフから学んだ事前学習モデルと、入札アフィニティ予測のための標準ベンチマークタスクを実行するためのソースコードもリリースしています。
関連論文リスト
- Multimodal Contrastive Representation Learning in Augmented Biomedical Knowledge Graphs [2.006175707670159]
PrimeKG++はマルチモーダルデータを組み込んだ豊富な知識グラフである。
提案手法は強い一般化可能性を示し,未知のノードに対しても正確なリンク予測を可能にする。
論文 参考訳(メタデータ) (2025-01-03T05:29:12Z) - Representation-Enhanced Neural Knowledge Integration with Application to Large-Scale Medical Ontology Learning [3.010503480024405]
本稿では,関係型の同時学習を実現するため,理論的に保証されたRENKIという統計フレームワークを提案する。
提案フレームワークは,表現学習出力をニューラルネットワークの初期エンティティ埋め込みに組み込んで,知識グラフのスコア関数を近似する。
ヘテロジニアス関係の存在下での重み付けの効果と、非パラメトリックモデルに表現学習を組み込むことの利点を実証する。
論文 参考訳(メタデータ) (2024-10-09T21:38:48Z) - Graph Stochastic Neural Process for Inductive Few-shot Knowledge Graph Completion [63.68647582680998]
I-FKGC(inductive few-shot knowledge graph completion)と呼ばれる課題に焦点をあてる。
帰納的推論(inductive reasoning)の概念に着想を得て,I-FKGCを帰納的推論問題とした。
本稿では,仮説の連成分布をモデル化したニューラルプロセスに基づく仮説抽出器を提案する。
第2のモジュールでは、この仮説に基づいて、クエリセットのトリプルが抽出された仮説と一致するかどうかをテストするグラフアテンションベースの予測器を提案する。
論文 参考訳(メタデータ) (2024-08-03T13:37:40Z) - MKDTI: Predicting drug-target interactions via multiple kernel fusion on graph attention network [37.40418564922425]
グラフアテンションネットワークの様々な層埋め込みからカーネル情報を抽出することにより、MKDTIと呼ばれるモデルを定式化する。
我々は、Dual Laplacian Regularized Least Squaresフレームワークを使用して、新規なドラッグターゲットエンティティ接続を予測する。
論文 参考訳(メタデータ) (2024-07-14T02:53:25Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Multi-modal Graph Learning for Disease Prediction [35.4310911850558]
病気予測のためのエンドツーエンドのマルチモーダルグラフ学習フレームワーク(MMGL)を提案する。
隣接行列を既存の手法として手動で定義する代わりに、潜在グラフ構造を適応グラフ学習の新しい方法によって捉えることができる。
論文 参考訳(メタデータ) (2021-07-01T03:59:22Z) - Exploring the Limits of Few-Shot Link Prediction in Knowledge Graphs [49.6661602019124]
数発のリンク予測を行うため,本手法の現況を一般化したモデルスペクトルについて検討する。
単純なゼロショットベースライン – 関係性固有の情報を無視する – が驚くほど高いパフォーマンスを実現しているのが分かります。
慎重に構築された合成データセットの実験では、関係の例がいくつかあるだけで、モデルがきめ細かな構造情報を使用するのを基本的に制限することが示されている。
論文 参考訳(メタデータ) (2021-02-05T21:04:31Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Explainable Deep Relational Networks for Predicting Compound-Protein
Affinities and Contacts [80.69440684790925]
Deep Relationsは物理にインスパイアされた、本質的に説明可能なアーキテクチャを持つディープリレーショナルネットワークである。
それは最先端技術に対する優れた解釈可能性を示している。
接触予測 9.5, 16.9, 19.3, 5.7 倍の AUPRC をテスト用、複合ユニク、タンパク質ユニク、両ユニクセットで強化する。
論文 参考訳(メタデータ) (2019-12-29T00:14:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。