論文の概要: BioPIE: A Biomedical Protocol Information Extraction Dataset for High-Reasoning-Complexity Experiment Question Answer
- arxiv url: http://arxiv.org/abs/2601.04524v1
- Date: Thu, 08 Jan 2026 02:44:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.000749
- Title: BioPIE: A Biomedical Protocol Information Extraction Dataset for High-Reasoning-Complexity Experiment Question Answer
- Title(参考訳): BioPIE:高推論・複雑度実験のためのバイオメディカルプロトコル情報抽出データセット
- Authors: Haofei Hou, Shunyi Zhao, Fanxu Meng, Kairui Yang, Lecheng Ruan, Qining Wang,
- Abstract要約: 高情報密度(HID)とMulti-Step Reasoning(MSR)は、生体医学実験QAに固有の課題を提起する。
既存のバイオメディカルデータセットは、一般的なまたは粗い知識に焦点を当てている。
BioPIEデータセットは、実験的なエンティティ、アクション、関係のプロシージャ中心のKGを提供する。
- 参考スコア(独自算出の注目度): 11.648155648575795
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Question Answer (QA) systems for biomedical experiments facilitate cross-disciplinary communication, and serve as a foundation for downstream tasks, e.g., laboratory automation. High Information Density (HID) and Multi-Step Reasoning (MSR) pose unique challenges for biomedical experimental QA. While extracting structured knowledge, e.g., Knowledge Graphs (KGs), can substantially benefit biomedical experimental QA. Existing biomedical datasets focus on general or coarsegrained knowledge and thus fail to support the fine-grained experimental reasoning demanded by HID and MSR. To address this gap, we introduce Biomedical Protocol Information Extraction Dataset (BioPIE), a dataset that provides procedure-centric KGs of experimental entities, actions, and relations at a scale that supports reasoning over biomedical experiments across protocols. We evaluate information extraction methods on BioPIE, and implement a QA system that leverages BioPIE, showcasing performance gains on test, HID, and MSR question sets, showing that the structured experimental knowledge in BioPIE underpins both AI-assisted and more autonomous biomedical experimentation.
- Abstract(参考訳): バイオメディカル実験のための質問応答システム(QA)は、学際的なコミュニケーションを促進し、実験室の自動化など下流作業の基盤として機能する。
高情報密度(HID)とMulti-Step Reasoning(MSR)は、生体医学実験QAに固有の課題を提起する。
構造化知識(例えば知識グラフ(KGs))を抽出しながらも、バイオメディカルな実験的なQAに有効である。
既存のバイオメディカルデータセットは、一般知識や粗粒度の知識に重点を置いているため、HIDとMSRが要求する詳細な実験的推論をサポートしない。
バイオメディカルプロトコル情報抽出データセット(BioPIE: Biomedical Protocol Information extract Dataset)は、実験対象、行動、関係の手順中心のKGを、プロトコル間でのバイオメディカル実験の推論を支援するスケールで提供するデータセットである。
我々は,BioPIEの情報抽出手法を評価し,BioPIEを利用したQAシステムの実装を行い,BioPIEにおける構造化実験知識が,AI支援と自律的なバイオメディカル実験の両方の基盤となることを示す。
関連論文リスト
- BioMedSearch: A Multi-Source Biomedical Retrieval Framework Based on LLMs [8.505934574757587]
大規模言語モデル(LLM)に基づくバイオメディカル情報検索フレームワークであるBioMedSearchについて述べる。
本手法は,文献検索,タンパク質データベース,Web検索アクセスを統合し,複雑なバイオメディカルクエリの正確かつ効率的な処理を支援する。
質問応答の精度を評価するために,3,000の質問からなる多レベルデータセットBioMedMCQを構築した。
論文 参考訳(メタデータ) (2025-10-15T13:01:31Z) - CaresAI at BioCreative IX Track 1 -- LLM for Biomedical QA [3.222047196930981]
大規模言語モデル(LLM)は、様々な領域にわたる正確な質問応答において、ますます明白になっている。
本稿では,BioCreative IX共有タスクのMedHopQAトラックへのアプローチについて述べる。
短い解答と長い解答を組み合わせた微調整、短い解答のみ、長い解答のみの3つの実験的な設定が検討されている。
論文 参考訳(メタデータ) (2025-08-31T11:40:02Z) - m-KAILIN: Knowledge-Driven Agentic Scientific Corpus Distillation Framework for Biomedical Large Language Models Training [22.996230737442254]
バイオメディカルな大規模言語モデル(LLM)のためのコーパスヘッダーは、オープンソースの科学コーパスにおいて、不十分な量と品質のプレス課題に対処しようとしている。
本稿では, バイオメディカル領域におけるLLMトレーニングに適した, 科学的コーパス蒸留のための知識駆動型エージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-28T08:18:24Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - BiomedGPT: A Generalist Vision-Language Foundation Model for Diverse Biomedical Tasks [68.39821375903591]
汎用AIは、さまざまなデータ型を解釈する汎用性のために、制限に対処する可能性を秘めている。
本稿では,最初のオープンソースかつ軽量な視覚言語基盤モデルであるBiomedGPTを提案する。
論文 参考訳(メタデータ) (2023-05-26T17:14:43Z) - BioIE: Biomedical Information Extraction with Multi-head Attention
Enhanced Graph Convolutional Network [9.227487525657901]
本稿では,バイオメディカルテキストと非構造化医療報告から関係を抽出するハイブリッドニューラルネットワークであるバイオメディカル情報抽出を提案する。
本研究は,2つの主要な生医学的関係抽出タスク,化学物質とタンパク質の相互作用,およびクロスホスピタル・パン・カンノロジー報告コーパスについて検討した。
論文 参考訳(メタデータ) (2021-10-26T13:19:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。