論文の概要: Weaving Multi-Source Evidence for Biomedical Reasoning: The BioMedHop Benchmark and BioWeave Framework
- arxiv url: http://arxiv.org/abs/2606.16211v1
- Date: Mon, 15 Jun 2026 04:38:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.084907
- Title: Weaving Multi-Source Evidence for Biomedical Reasoning: The BioMedHop Benchmark and BioWeave Framework
- Title(参考訳): バイオメディカル推論のためのマルチソースエビデンス: BioMedHopベンチマークとBioWeaveフレームワーク
- Authors: Xingyu Tan, Shiyuan Liu, Xiaoyang Wang, Qing Liu, Xiwei Xu, Xin Yuan, Liming Zhu, Wenjie Zhang,
- Abstract要約: 構造化されたエビデンストポロジよりもバイオメディカル推論を評価するためのグラフグラウンドベンチマークであるBioMedHopを紹介した。
バイオメディカルなKG経路を検索し、文書やWebソースからの手がかりを収集し、エンティティレベルのエビデンスサポートを通じて回答を検証する。
BioWeaveは、BioMedHopで比較した手法の中で最高の全体的なパフォーマンスを達成し、ToG-2の強力なハイブリッドベースラインを平均で10.5%上回った。
- 参考スコア(独自算出の注目度): 22.541216949613716
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biomedical question answering (QA) increasingly requires reasoning over interacting entities, where supporting evidence is scattered across biomedical knowledge graphs, literature documents, and web-accessible resources. However, existing biomedical QA benchmarks mainly focus on exam-style knowledge, literature comprehension, or short-range multi-hop inference, leaving source-conditioned graph reasoning and evidence topology construction underexplored. To fill this gap, we introduce BioMedHop, a multi-source graph-grounded benchmark for evaluating biomedical reasoning over structured evidence topologies. BioMedHop contains 10,045 instances across KG, document, web, and hybrid evidence settings, covering shared-neighbor matching, intersection reasoning, path-based reasoning, and counting, with option-based, open-ended, and numeric count renderings. To support this benchmark, we further propose BioWeave, a source-aware reasoning framework that retrieves biomedical KG paths, gathers supporting clues from documents and web sources, assembles them into a unified evidence graph, and verifies answers through entity-level evidence support. Comprehensive experiments show that BioWeave achieves the best overall performance among compared methods on BioMedHop, outperforming the strong hybrid baseline ToG-2 by 10.5% in the overall average. Moreover, BioWeave consistently improves different LLM backbones and enables smaller models, such as Qwen3-4B, to achieve reasoning performance comparable to GPT-4-Turbo.
- Abstract(参考訳): バイオメディカル質問応答(英語版)(QA)は、バイオメディカル知識グラフ、文献文書、ウェブアクセス可能なリソースに証拠が散在する相互作用するエンティティに対する推論をますます要求している。
しかし、既存のバイオメディカルQAベンチマークは、主に試験スタイルの知識、文献理解、短距離マルチホップ推論に重点を置いており、ソース条件付きグラフ推論とエビデンストトポロジ構築は未調査のままである。
このギャップを埋めるために、構造化されたエビデンストポロジに対するバイオメディカル推論を評価するためのマルチソースグラフグラウンドベンチマークであるBioMedHopを紹介する。
BioMedHopには、KG、ドキュメント、Web、ハイブリッドエビデンス設定にまたがる10,045のインスタンスが含まれており、共有隣り合うマッチング、交差点推論、パスベースの推論、カウント、オプションベース、オープンエンド、数値のレンダリングなどを含んでいる。
このベンチマークを支援するために,生物医学的なKGパスを検索し,文書やWebソースからの手がかりを収集し,それらを統一されたエビデンスグラフに集約し,エンティティレベルのエビデンスサポートを通じて回答を検証する,ソース対応推論フレームワークであるBioWeaveを提案する。
総合的な実験により、BioWeaveはBioMedHopで比較した手法の中で最高の総合性能を達成し、ToG-2の強力なハイブリッドベースラインを10.5%上回った。
さらに、BioWeaveは、異なるLCMバックボーンを一貫して改善し、Qwen3-4Bのようなより小さなモデルで、GPT-4-Turboに匹敵する推論性能を実現する。
関連論文リスト
- MedHopQA: A Disease-Centered Multi-Hop Reasoning Benchmark and Evaluation Framework for LLM-Based Biomedical Question Answering [11.3883842897598]
MedHopQAは、1000の専門家による質問応答ペアからなる、疾患中心のマルチホップ推論ベンチマークである。
各質問はウィキペディアの異なる2つの記事にまたがる情報の合成を必要とし、回答はオープンエンドのフリーテキスト形式で提供される。
論文 参考訳(メタデータ) (2026-05-12T16:32:43Z) - PlantMarkerBench: A Multi-Species Benchmark for Evidence-Grounded Plant Marker Reasoning [10.873172077806798]
PlantMarkerBenchは、フルテキストの生物学的論文から文献的な植物マーカーのエビデンスを解釈するベンチマークである。
4つの植物種にまたがり、5,550件の文章レベルのエビデンス・インスタンスが含まれており、マーカーのエビデンス、エビデンス・タイプ、サポートの強さを示す。
種々にわたる多様なオープンソースおよびクローズドソースの言語モデルをベンチマークし、戦略を推進します。
論文 参考訳(メタデータ) (2026-05-11T05:57:15Z) - BioMiner: A Multi-modal System for Automated Mining of Protein-Ligand Bioactivity Data from Literature [53.894504720119805]
生物活性データ抽出のためのマルチモーダル抽出フレームワークであるBioMinerを紹介する。
BioMinerでは、生物活性セマンティクスは直接推論によって推測され、化学構造は化学構造に基づく視覚的セマンティクス推論パラダイムによって解決される。
厳密な評価と方法開発のために,500の出版物から得られた16,457の生物活性成分からなるベンチマークを構築した。
論文 参考訳(メタデータ) (2026-04-23T10:11:56Z) - RAG-BioQA Retrieval-Augmented Generation for Long-Form Biomedical Question Answering [0.0]
本稿では,検索拡張世代とドメイン固有の微調整を組み合わせた新しいフレームワークであるRAG-BioQAについて述べる。
PubMedQAデータセットの実験結果は、ベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-10-02T02:49:09Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Biomedical Relation Extraction via Adaptive Document-Relation Cross-Mapping and Concept Unique Identifier [35.79876359248485]
Document-Level Biomedical Relation extract (Bio-RE) は、バイオメディカルエンティティ間の関係を広範囲にわたるテキスト内で識別することを目的としている。
従来の手法は文書の不完全性を見落とし、外部知識の統合を欠いていることが多い。
大規模言語モデル(LLM)の最近の進歩は、ドキュメントレベルのBio-REに関する上記の問題をすべて探求するきっかけとなりました。
論文 参考訳(メタデータ) (2025-01-09T11:19:40Z) - BioT5+: Towards Generalized Biological Understanding with IUPAC Integration and Multi-task Tuning [77.90250740041411]
本稿では,BioT5フレームワークの拡張であるBioT5+を紹介する。
BioT5+ には、分子理解のための IUPAC 名の統合、bioRxiv や PubChem などのソースからの広範なバイオテキストと分子データの統合、タスク間の汎用性のためのマルチタスク命令チューニング、数値データの処理を改善する数値トークン化技術など、いくつかの新機能が含まれている。
論文 参考訳(メタデータ) (2024-02-27T12:43:09Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。