論文の概要: Building evidence-based knowledge graphs from full-text literature for disease-specific biomedical reasoning
- arxiv url: http://arxiv.org/abs/2603.28325v1
- Date: Mon, 30 Mar 2026 11:53:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.371323
- Title: Building evidence-based knowledge graphs from full-text literature for disease-specific biomedical reasoning
- Title(参考訳): 病原性バイオメディカル推論のためのフルテキスト文献からのエビデンスに基づく知識グラフの構築
- Authors: Chang Zong, Sicheng Lv, Si-tu Xue, Huilin Zheng, Jian Wan, Lei Zhang,
- Abstract要約: EvidenceNet(エビデンスネット)は、フルテキストのバイオメディカル文献から病気特有の知識グラフを構築するためのフレームワークである。
EvidenceNetは、大規模言語モデル(LLM)支援パイプラインを使用して、構造化されたエビデンスノードとして実験的な根拠のある発見を抽出し、バイオメディカルエンティティを標準化し、エビデンスの品質を評価し、型付きセマンティック関係を通じてエビデンスレコードを接続する。
技術検証は、98.3%のフィールドレベルの抽出精度、100.0%の高信頼エンティティリンク精度、87.5%の融合完全性、90.0%の意味関係型精度を含む、高いコンポーネント忠実度を示す。
- 参考スコア(独自算出の注目度): 5.198797072162084
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Biomedical knowledge resources often either preserve evidence as unstructured text or compress it into flat triples that omit study design, provenance, and quantitative support. Here we present EvidenceNet, a framework and dataset for building disease-specific knowledge graphs from full-text biomedical literature. EvidenceNet uses a large language model (LLM)-assisted pipeline to extract experimentally grounded findings as structured evidence nodes, normalize biomedical entities, score evidence quality, and connect evidence records through typed semantic relations. We release two resources: EvidenceNet-HCC with 7,872 evidence records, 10,328 graph nodes, and 49,756 edges, and EvidenceNet-CRC with 6,622 records, 8,795 nodes, and 39,361 edges. Technical validation shows high component fidelity, including 98.3% field-level extraction accuracy, 100.0% high-confidence entity-link accuracy, 87.5% fusion integrity, and 90.0% semantic relation-type accuracy. In downstream evaluation, EvidenceNet improves internal and external retrieval-augmented question answering and retains structural signal for future link prediction and target prioritization. These results establish EvidenceNet as a disease-specific resource for evidence-aware biomedical reasoning and hypothesis generation.
- Abstract(参考訳): 生物医学の知識資源は、しばしば証拠を非構造化のテキストとして保存するか、それを平らな3重に圧縮し、設計、証明、量的支援を省略する。
ここでは、フルテキストのバイオメディカル文献から病原性知識グラフを構築するためのフレームワークとデータセットであるEvidenceNetを紹介する。
EvidenceNetは、大規模言語モデル(LLM)支援パイプラインを使用して、構造化されたエビデンスノードとして実験的な根拠のある発見を抽出し、バイオメディカルエンティティを標準化し、エビデンスの品質を評価し、型付きセマンティック関係を通じてエビデンスレコードを接続する。
7,872のエビデンスレコードを持つEvidenceNet-HCC、10,328のグラフノード、49,756のエッジを持つEvidenceNet-CRC、6,622のレコードを持つEvidenceNet-CRC、8,795のノード、39,361のエッジを持つ。
技術検証は、98.3%のフィールドレベルの抽出精度、100.0%の高信頼エンティティリンク精度、87.5%の融合完全性、90.0%の意味関係型精度を含む、高いコンポーネント忠実度を示す。
下流評価において、EvidenceNetは、内部および外部の検索強化された質問応答を改善し、将来のリンク予測とターゲット優先順位付けのための構造信号を保持する。
これらの結果は,エビデンスネットを,エビデンスをバイオメディカル推論と仮説生成のための病原性資源として確立している。
関連論文リスト
- SIN-Bench: Tracing Native Evidence Chains in Long-Context Multimodal Scientific Interleaved Literature [92.88058660627678]
FITO(Fish-in-the-Ocean)パラダイムは、科学文書の中に明確なクロスモーダルなエビデンスチェーンを構築するモデルを必要とする。
我々は、証拠発見(SIN-Find)、仮説検証(SIN-Verify)、接地QA(SIN-QA)、エビデンスアンコレッド合成(SIN-Summary)の4つのプログレッシブなタスクでSIN-Benchを構築する。
検証可能なアンカーに基づき、マッチング、関連性、論理による証拠品質の診断を行う際に、予測値を評価する「No Evidence, No Score」を導入する。
論文 参考訳(メタデータ) (2026-01-15T06:25:25Z) - Combating Biomedical Misinformation through Multi-modal Claim Detection and Evidence-based Verification [11.555285143713315]
CER(Combining Evidence and Reasoning)は、バイオメディカルな事実チェックのための新しいフレームワークである。
科学的エビデンス検索、大規模言語モデルによる推論、および教師付き正確性予測を統合している。
幻覚のリスクを効果的に軽減し、生成したアウトプットが検証可能なエビデンスベースの情報源で根拠付けられていることを保証する。
論文 参考訳(メタデータ) (2025-09-17T10:31:09Z) - Combining Evidence and Reasoning for Biomedical Fact-Checking [11.555285143713315]
CER(Combin-ing Evidence and Reasoning)は、バイオメディカルな事実チェックのための新しいフレームワークである。
科学的エビデンス検索、大規模言語モデルによる推論、および教師付き正確性予測を統合している。
論文 参考訳(メタデータ) (2025-09-17T10:14:56Z) - Enabling Down Syndrome Research through a Knowledge Graph-Driven Analytical Framework [0.4376081656448856]
ダウンシンドローム(Down syndrome)は、様々な臨床症状を有する多面性遺伝疾患である。
異質性や断片化されたデータは、包括的な研究と翻訳の発見に挑戦する。
7,148人の参加者,456の条件,501の表現型,および37,000以上の生物種を統合されたインフラストラクチャに変換する知識グラフ駆動型プラットフォームを開発した。
論文 参考訳(メタデータ) (2025-09-01T15:50:38Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Causal Discovery from Data Assisted by Large Language Models [50.193740129296245]
知識駆動発見のために、実験データと事前のドメイン知識を統合することが不可欠である。
本稿では、高分解能走査透過電子顕微鏡(STEM)データと大規模言語モデル(LLM)からの洞察を組み合わせることで、このアプローチを実証する。
SmドープBiFeO3(SmBFO)におけるChatGPTをドメイン固有文献に微調整することにより、構造的、化学的、分極的自由度の間の因果関係をマッピングするDAG(Directed Acyclic Graphs)の隣接行列を構築する。
論文 参考訳(メタデータ) (2025-03-18T02:14:49Z) - Heterogeneous Graph Reasoning for Fact Checking over Texts and Tables [22.18384189336634]
HeterFCは、非構造化情報および構造化情報に対するFact Checkingのための単語レベルの不均一グラフベースのモデルである。
我々は,レーショナルグラフニューラルネットワークによる情報伝達,クレームとエビデンス間の相互作用を行う。
本稿では,エビデンス検索における潜在的な不正確性を考慮したマルチタスク損失関数を提案する。
論文 参考訳(メタデータ) (2024-02-20T14:10:40Z) - Fact-Checking Generative AI: Ontology-Driven Biological Graphs for Disease-Gene Link Verification [45.65374554914359]
本研究の目的は,ChatGPTの内容から得られた生物学的グラフに埋め込まれた知識の事実チェックを実現することである。
そこで我々は,ChatGPTの関連エンティティの系統的尋問を可能にする生物学的ネットワークアプローチを採用した。
本研究は,ChatGPT生成テキスト中の集合疾患遺伝子関係の高精度な解析を行った。
論文 参考訳(メタデータ) (2023-08-07T22:13:30Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。