論文の概要: Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey
- arxiv url: http://arxiv.org/abs/2302.08261v3
- Date: Wed, 24 Jul 2024 07:26:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 20:09:44.784992
- Title: Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey
- Title(参考訳): 薬物発見のための知識強化グラフ機械学習:サーベイ
- Authors: Zhiqiang Zhong, Anastasia Barkova, Davide Mottin,
- Abstract要約: グラフ機械学習(GML)は、グラフ構造化バイオメディカルデータをモデル化する優れた能力で注目されている。
近年の研究では、より正確で解釈可能な薬物発見を実現するために、外部のバイオメディカル知識をGMLパイプラインに統合することを提案した。
- 参考スコア(独自算出の注目度): 6.288056740658763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of Artificial Intelligence (AI) into the field of drug discovery has been a growing area of interdisciplinary scientific research. However, conventional AI models are heavily limited in handling complex biomedical structures (such as 2D or 3D protein and molecule structures) and providing interpretations for outputs, which hinders their practical application. As of late, Graph Machine Learning (GML) has gained considerable attention for its exceptional ability to model graph-structured biomedical data and investigate their properties and functional relationships. Despite extensive efforts, GML methods still suffer from several deficiencies, such as the limited ability to handle supervision sparsity and provide interpretability in learning and inference processes, and their ineffectiveness in utilising relevant domain knowledge. In response, recent studies have proposed integrating external biomedical knowledge into the GML pipeline to realise more precise and interpretable drug discovery with limited training instances. However, a systematic definition for this burgeoning research direction is yet to be established. This survey presents a comprehensive overview of long-standing drug discovery principles, provides the foundational concepts and cutting-edge techniques for graph-structured data and knowledge databases, and formally summarises Knowledge-augmented Graph Machine Learning (KaGML) for drug discovery. we propose a thorough review of related KaGML works, collected following a carefully designed search methodology, and organise them into four categories following a novel-defined taxonomy. To facilitate research in this promptly emerging field, we also share collected practical resources that are valuable for intelligent drug discovery and provide an in-depth discussion of the potential avenues for future advancements.
- Abstract(参考訳): 人工知能(AI)の創薬分野への統合は、学際的な科学研究の領域として成長している。
しかし、従来のAIモデルは、2Dや3Dタンパク質や分子構造のような複雑な生体医学構造を扱うことに大きく制限されており、出力の解釈を提供しており、その実用的な応用を妨げている。
近年、グラフ機械学習(GML)は、グラフ構造化バイオメディカルデータをモデル化し、それらの特性と機能的関係を調査する能力において、非常に注目されている。
広範囲にわたる努力にもかかわらず、GMLの手法は依然としていくつかの欠陥に悩まされている。例えば、監督の空間性を扱う能力の制限や、学習と推論プロセスにおける解釈可能性の提供、関連するドメイン知識の活用におけるそれらの非効率性などである。
これに対し、最近の研究では、限られたトレーニングインスタンスでより正確で解釈可能な薬物発見を実現するために、外部のバイオメディカル知識をGMLパイプラインに統合することを提案した。
しかし、この急成長する研究方向の体系的な定義はまだ確立されていない。
本調査では,長期間にわたる薬物発見の原則を概観し,グラフ構造化データおよび知識データベースの基礎概念と最先端技術を提供し,薬物発見のための知識強化グラフ機械学習(KaGML)を正式に要約する。
そこで本研究では,精巧に設計された探索手法に従って収集された関連するKaGML作品の網羅的なレビューを行い,新しい分類法に従って4つのカテゴリに分類する。
この急激な新興分野の研究を促進するために、我々は、インテリジェントな薬物発見に有用な収集された実践的資源を共有し、今後の発展に向けての潜在的な道筋について深く議論する。
関連論文リスト
- Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - Simplicity within biological complexity [0.0]
文献を調査し、マルチスケール分子ネットワークデータの埋め込みのための包括的フレームワークの開発について論じる。
ネットワーク埋め込み手法はノードを低次元空間の点にマッピングすることにより、学習空間の近接性はネットワークのトポロジ-関数関係を反映する。
本稿では,モデルから効率的かつスケーラブルなソフトウェア実装に至るまで,マルチオミックネットワークデータのための汎用的な包括的埋め込みフレームワークを開発することを提案する。
論文 参考訳(メタデータ) (2024-05-15T13:32:45Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - Learning a Patent-Informed Biomedical Knowledge Graph Reveals Technological Potential of Drug Repositioning Candidates [6.268435617836703]
本研究では, 医薬品特許やバイオメディカルデータベースなど, さまざまな資料を解析するための新しいプロトコルを提案する。
薬物再配置候補を, 技術的可能性と科学的証拠の両方で同定する。
アルツハイマー病の症例研究は,その有効性と実現可能性を示している。
論文 参考訳(メタデータ) (2023-09-04T02:30:19Z) - ImDrug: A Benchmark for Deep Imbalanced Learning in AI-aided Drug
Discovery [79.08833067391093]
現実世界の医薬品のデータセットは、しばしば高度に不均衡な分布を示す。
ImDrugはオープンソースのPythonライブラリを備えたベンチマークで、4つの不均衡設定、11のAI対応データセット、54の学習タスク、16のベースラインアルゴリズムで構成されています。
ドラッグ発見パイプラインの幅広い範囲にまたがる問題やソリューションに対して、アクセス可能でカスタマイズ可能なテストベッドを提供する。
論文 参考訳(メタデータ) (2022-09-16T13:35:57Z) - Scientific Language Models for Biomedical Knowledge Base Completion: An
Empirical Study [62.376800537374024]
我々は,KG の完成に向けた科学的 LM の研究を行い,生物医学的リンク予測を強化するために,その潜在知識を活用できるかどうかを探る。
LMモデルとKG埋め込みモデルを統合し,各入力例をいずれかのモデルに割り当てることを学ぶルータ法を用いて,性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-06-17T17:55:33Z) - A Review of Biomedical Datasets Relating to Drug Discovery: A Knowledge
Graph Perspective [4.746544835197422]
薬物発見分野に新しい技術を適用することに興味を持つ機械学習や知識グラフの実践者を支援することを目的としている。
様々な創薬中心の知識グラフの構築に適した情報を含む公開のプライマリデータソースを詳細に説明します。
論文 参考訳(メタデータ) (2021-02-19T17:49:38Z) - Utilising Graph Machine Learning within Drug Discovery and Development [19.21101749270075]
グラフ機械学習(gml)は、生体分子構造をモデル化する能力から、製薬およびバイオテクノロジー業界で注目を集めている。
本稿では,創薬・開発におけるトピックの多分野の学術・産業的考察を行う。
重要な用語とモデリングアプローチを導入した後、薬物開発パイプラインを経時的に経時的に移動し、標的の同定、小さな分子や生物の設計、薬物の再利用などを含む作業の特定と要約を行う。
論文 参考訳(メタデータ) (2020-12-09T10:12:33Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。