論文の概要: UniD$^3$: A Knowledge Graph-Enhanced RAG Framework for Drug-Disease Discovery and Reasoning
- arxiv url: http://arxiv.org/abs/2606.01394v1
- Date: Sun, 31 May 2026 18:36:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.680154
- Title: UniD$^3$: A Knowledge Graph-Enhanced RAG Framework for Drug-Disease Discovery and Reasoning
- Title(参考訳): UniD$^3$: 医薬品の発見と推論のための知識グラフ強化RAGフレームワーク
- Authors: Qing Wang, Tianshi Liu, Minghao Zhou, Jialu Liang, Sen Guo, Guangyu Wang, Jing Su, Qianqian Song,
- Abstract要約: 大規模言語モデルと知識グラフ強化検索生成(KG-RAG)を統合した統合フレームワークUniD$3$を紹介する。
UniD$3$ Process 157,849 PubMed article with Llama 3.3-70B は、2段階戦略で知識グラフを構築する。
これらのグラフは、KG-RAGベースの構造化データセットの生成、外部ベンチマークによる評価、キュレートされたリソースとのファジィマッチング、臨床レビューをサポートする。
- 参考スコア(独自算出の注目度): 10.616744261460376
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Systematic characterization of drug-disease relationships is essential for drug discovery and repurposing, yet is hindered by the heterogeneity and rapid growth of biomedical literature. Existing datasets rely on labor-intensive curation and are often incomplete, while LLM-only approaches suffer from hallucination and weak evidence grounding. We introduce UniD$^3$, a unified framework that integrates Large Language Models with Knowledge Graph-enhanced Retrieval-Augmented Generation (KG-RAG) to extract, organize, and validate drug-disease knowledge across Drug-Disease Matching (DDM), Drug Effectiveness Assessment (DEA), and Drug-Target Analysis (DTA). UniD$^3$ processes 157,849 PubMed articles with Llama 3.3-70B and constructs knowledge graphs via a dual-stage strategy combining paper-level extraction with KG-level consolidation centered on drug and disease entities. These graphs support KG-RAG-based generation of structured datasets, evaluated through external benchmarks, fuzzy matching with curated resources, and clinician review. UniD$^3$ produces six knowledge graphs and large-scale datasets, including 28,915 DDM, 15,042 DEA, and over 4,000 DTA QA pairs. External validation shows strong performance (F1: 0.85-0.87 for DDM/DEA; 0.82 for DTA), with clinician review confirming high reliability (AUROC = 0.90). KG-RAG-augmented models outperform standalone LLMs, and the UniD$^3$ chatbot enables interpretable, citation-supported exploration of drug-disease relationships. UniD$^3$ provides a scalable, extensible framework for transforming unstructured biomedical literature into high-quality, structured drug-disease knowledge, supporting AI-driven discovery, repurposing, and precision medicine.
- Abstract(参考訳): 薬物と薬物の関係の体系的特徴は、医薬品の発見と再資源化に不可欠であるが、生物医学文献の不均一性と急速な成長によって妨げられている。
既存のデータセットは労働集約的なキュレーションに依存しており、しばしば不完全である。
UniD$^3$は、大規模言語モデルと知識グラフ強化検索生成(KG-RAG)を統合した統合フレームワークで、ドラッグ・ディスリーズマッチング(DDM)、ドラッグ・エフェクトネス・アセスメント(DEA)、ドラッグ・ターゲット分析(DTA)を通じてドラッグ・ディスリーズ知識を抽出、整理、検証する。
UniD$^3$ Process 157,849 PubMed article with Llama 3.3-70B, and constructs of knowledge graphs through a dual-stage strategy with paper-level extract with KG-level consolidation based on drug and disease entity。
これらのグラフは、KG-RAGベースの構造化データセットの生成、外部ベンチマークによる評価、キュレートされたリソースとのファジィマッチング、臨床レビューをサポートする。
UniD$^3$は、28,915 DDM、15,042 DEA、4000 DTA QAペアを含む6つのナレッジグラフと大規模データセットを生成する。
外的検証は高い性能(DDM/DEAは0.85-0.87、DTAは0.82)を示し、臨床検査では高い信頼性(AUROC = 0.90)が確認された。
KG-RAG強化モデルはスタンドアローンのLCMよりも優れており、UniD$^3$チャットボットは解釈可能で引用支援されたドラッグ・ディスリーズ関係の探索を可能にする。
UniD$^3$は、非構造化バイオメディカル文献を高品質で構造化された薬物放出知識に変換するためのスケーラブルで拡張可能なフレームワークを提供する。
関連論文リスト
- Eliciting Medical Reasoning with Knowledge-enhanced Data Synthesis: A Semi-Supervised Reinforcement Learning Approach [62.0906177191353]
既存のアプローチでは、教師付き微調整を経て、大規模プロプライエタリモデルからの連鎖推論トレースを蒸留し、強化学習(RL)を実施している。
MedSSRは,医療知識を付加したデータ合成と半教師付き強化学習フレームワークである。
本フレームワークはまず, 分布制御可能な推論質問を合成するために, 稀な疾患知識を利用する。
次に、ポリシーモデル自体を利用して高品質な擬似ラベルを生成する。これにより、擬似ラベルデータ上での自己教師型RLと、人間の注釈付き実データ上での教師型RLの2段階固有の訓練パラダイムが実現される。
論文 参考訳(メタデータ) (2026-04-13T14:37:38Z) - SIDEKICK: A Semantically Integrated Resource for Drug Effects, Indications, and Contraindications [11.439066289590878]
Sidekick(サイドキック)は、FDA構造化製品ラベルからの薬物の表示、禁忌、および副作用を標準化する知識グラフである。
我々は5万以上の薬物ラベルを処理し、Human Phenotype Ontology(HPO)、MONDO Disease Ontology、RxNormにマッピングした。
Sidekickは、薬物再資源化のための安全に基づく自動類似性分析を可能にする。
論文 参考訳(メタデータ) (2025-12-06T17:35:07Z) - MedGR$^2$: Breaking the Data Barrier for Medical Reasoning via Generative Reward Learning [4.579424650757833]
既存のデータセット上での監視ファインチューニング(SFT)はしばしば、目に見えないモダリティやタスクの一般化が不十分になる。
我々は,自己改善型活力サイクルを創出する新しいフレームワークである,医療推論のためのジェネレーティブ・リワード・ラーニング(MedGR$2$)を紹介した。
我々の実験は、MedGR$2$生産データを用いたSFTが、大規模で人為的なデータセットで訓練されたベースラインを超えることを実証した。
論文 参考訳(メタデータ) (2025-08-28T08:41:32Z) - MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph [57.54231831309079]
我々は、時間的に進化する医療知識グラフを構築するためのフレームワークであるMedKGentを紹介する。
生医学的知識の出現を, 微粒な日々の時系列でシミュレートする。
結果として得られるKGは156,275個のエンティティと2,971,384個のリレーショナルトリプルを含む。
論文 参考訳(メタデータ) (2025-08-17T15:14:03Z) - Retrieval Augmented Large Language Model System for Comprehensive Drug Contraindications [0.0]
大規模言語モデル(LLM)の汎用性は、様々な分野にわたって検討されてきたが、医療への応用には課題がある。
本研究では,レトリーバル拡張生成(RAG)パイプラインを実装することにより,LLMの対位法に効果的に対応する能力を高める。
論文 参考訳(メタデータ) (2025-08-08T09:09:03Z) - RAG-based Architectures for Drug Side Effect Retrieval in LLMs [0.0]
大きな言語モデル(LLM)は、有望な対話インターフェースを提供するが、その固有の制限は、薬品の移動のような専門分野における信頼性を妨げている。
本稿では,Llama 3 8B言語モデルに薬物副作用の包括的知識を組み込んだ検索型RAG(Retrieval-Augmented Generation)とグラフRAG(GraphRAG)の2つのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-07-18T11:20:52Z) - DrugPilot: LLM-based Parameterized Reasoning Agent for Drug Discovery [54.79763887844838]
大規模言語モデル(LLM)と自律エージェントの統合は、自動推論とタスク実行を通じて科学的発見を促進する大きな可能性を秘めている。
本稿では,薬物発見におけるエンドツーエンド科学のために設計されたパラメータ化推論アーキテクチャを備えたLSMベースのエージェントシステムであるDrarmPilotを紹介する。
DrugPilot は ReAct や LoT のような最先端のエージェントよりも優れており、タスク完了率は98.0%、93.5%、64.0%である。
論文 参考訳(メタデータ) (2025-05-20T05:18:15Z) - Boosting drug-disease association prediction for drug repositioning via dual-feature extraction and cross-dual-domain decoding [9.721502993958193]
我々はDual-Feature Drug Repurposing Neural Network (DFDRNN)と呼ばれる新しいモデルを提案する。
DFDRNNは、薬物や疾患をコード化するために、医薬品の生医学ネットワークから2つの特徴(類似性と関連性)をマイニングすることができる。
提案するDFDRNNモデルは,4つのベンチマークデータセット上で6つの最先端手法より優れている。
論文 参考訳(メタデータ) (2024-07-16T15:02:18Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - SSM-DTA: Breaking the Barriers of Data Scarcity in Drug-Target Affinity
Prediction [127.43571146741984]
薬物標的親和性(DTA)は、早期の薬物発見において極めて重要である。
湿式実験は依然として最も信頼性の高い方法であるが、時間と資源が集中している。
既存の手法は主に、データ不足の問題に適切に対処することなく、利用可能なDTAデータに基づく技術開発に重点を置いている。
SSM-DTAフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-06-20T14:53:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。