論文の概要: BioVerge: A Comprehensive Benchmark and Study of Self-Evaluating Agents for Biomedical Hypothesis Generation
- arxiv url: http://arxiv.org/abs/2511.08866v1
- Date: Thu, 13 Nov 2025 01:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.268227
- Title: BioVerge: A Comprehensive Benchmark and Study of Self-Evaluating Agents for Biomedical Hypothesis Generation
- Title(参考訳): BioVerge: バイオメディカル仮説生成のための総合的ベンチマークと自己評価エージェントの検討
- Authors: Fuyi Yang, Chenchen Ye, Mingyu Derek Ma, Yijia Xiao, Matthew Yang, Wei Wang,
- Abstract要約: 我々は、総合的なベンチマークであるBioVergeとLLMベースのエージェントフレームワークであるBioVerge Agentを導入し、バイオメディカル仮説生成のための標準化された環境を構築する。
本データセットは, LLMエージェントによる探索を支援するために組織された, 歴史的生物医学的仮説とPubMed文献から得られた構造化およびテキストデータを含む。
- 参考スコア(独自算出の注目度): 16.117624717812863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hypothesis generation in biomedical research has traditionally centered on uncovering hidden relationships within vast scientific literature, often using methods like Literature-Based Discovery (LBD). Despite progress, current approaches typically depend on single data types or predefined extraction patterns, which restricts the discovery of novel and complex connections. Recent advances in Large Language Model (LLM) agents show significant potential, with capabilities in information retrieval, reasoning, and generation. However, their application to biomedical hypothesis generation has been limited by the absence of standardized datasets and execution environments. To address this, we introduce BioVerge, a comprehensive benchmark, and BioVerge Agent, an LLM-based agent framework, to create a standardized environment for exploring biomedical hypothesis generation at the frontier of existing scientific knowledge. Our dataset includes structured and textual data derived from historical biomedical hypotheses and PubMed literature, organized to support exploration by LLM agents. BioVerge Agent utilizes a ReAct-based approach with distinct Generation and Evaluation modules that iteratively produce and self-assess hypothesis proposals. Through extensive experimentation, we uncover key insights: 1) different architectures of BioVerge Agent influence exploration diversity and reasoning strategies; 2) structured and textual information sources each provide unique, critical contexts that enhance hypothesis generation; and 3) self-evaluation significantly improves the novelty and relevance of proposed hypotheses.
- Abstract(参考訳): 生物医学研究における仮説生成は、伝統的に、文学に基づく発見(LBD)のような手法を用いて、広大な科学文献の中で隠れた関係を明らかにすることに焦点を当ててきた。
進歩にもかかわらず、現在のアプローチは一般的に単一のデータタイプや事前定義された抽出パターンに依存し、新規で複雑な接続の発見を制限する。
近年のLarge Language Model (LLM) エージェントの進歩は,情報検索,推論,生成能力に有意な可能性を示唆している。
しかし、それらのバイオメディカル仮説生成への応用は、標準化されたデータセットや実行環境の欠如によって制限されている。
そこで本研究では,総合的なベンチマークであるBioVergeと,LLMベースのエージェントフレームワークであるBioVerge Agentを導入し,既存の科学的知識の最前線で生物医学的仮説生成を探索するための標準化環境を構築する。
本データセットは, LLMエージェントによる探索を支援するために組織された, 歴史的生物医学的仮説とPubMed文献から得られた構造化およびテキストデータを含む。
BioVerge Agentは、ReActベースのアプローチを使用して、反復的に生成し、仮説を自己評価する、異なる生成および評価モジュールを使用する。
広範な実験を通じて、私たちは重要な洞察を明らかにしました。
1)BioVerge Agentの異なるアーキテクチャは、探索の多様性と推論戦略に影響を与える。
2) 構造化情報ソースとテキスト情報ソースは,それぞれ,仮説生成を促進するユニークな,批判的なコンテキストを提供する。
3)自己評価は提案された仮説の新規性と関連性を著しく改善する。
関連論文リスト
- Hypothesis Hunting with Evolving Networks of Autonomous Scientific Agents [52.50038914857797]
この過程を仮説探索と呼び、膨大な複雑な仮説空間を横断する持続的な探索を通して洞察を累積的に探索する。
本稿では、エージェント、ネットワーク、評価規範の相互作用としてフレームワークモデリングディスカバリであるAScienceを紹介し、ASCollabとして実装する。
実験により、このような社会的ダイナミクスは、多様性-品質-ノーベルティフロンティアに沿った専門家評価結果の蓄積を可能にすることが示された。
論文 参考訳(メタデータ) (2025-10-08T08:47:07Z) - BioDisco: Multi-agent hypothesis generation with dual-mode evidence, iterative feedback and temporal evaluation [0.0]
既存の自動化手法は、斬新で根拠に基づく仮説を生成するのに苦労している。
BioDiscoは言語モデルに基づく推論とデュアルモードエビデンスシステムに基づくマルチエージェントフレームワークである。
論文 参考訳(メタデータ) (2025-08-02T09:32:52Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Large Language Models as Biomedical Hypothesis Generators: A Comprehensive Evaluation [15.495976478018264]
大規模言語モデル(LLM)は、知識相互作用に革命をもたらす有望なツールとして登場した。
バイオメディカル文献から背景と仮説のペアのデータセットを構築し、トレーニング、観察、および見えないテストセットに分割する。
最上位モデルの仮説生成能力を、ゼロショット、少数ショット、微調整設定で評価する。
論文 参考訳(メタデータ) (2024-07-12T02:55:13Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - SciMON: Scientific Inspiration Machines Optimized for Novelty [68.46036589035539]
文献に基づく新たな科学的方向を生成するために,ニューラルランゲージモデルを探索し,拡張する。
モデルが入力背景コンテキストとして使用される新しい設定で、劇的な出発をとっています。
本稿では,過去の科学的論文から「吸入」を抽出するモデリングフレームワークであるSciMONを紹介する。
論文 参考訳(メタデータ) (2023-05-23T17:12:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。