論文の概要: BioResearcher: Scenario-Guided Multi-Agent for Translational Medicine
- arxiv url: http://arxiv.org/abs/2605.05985v1
- Date: Thu, 07 May 2026 10:33:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.700637
- Title: BioResearcher: Scenario-Guided Multi-Agent for Translational Medicine
- Title(参考訳): BioResearcher: シナリオガイドによる翻訳医療用マルチエージェント
- Authors: Remigiusz Kinas, Joanna Krawczyk, Rafał Powalski, Przemysław Pietrzak, Agnieszka Kowalewska, Krzysztof Kolmus, Maciej Sypetkowski, Łukasz Smoliński, Tomasz Jetka,
- Abstract要約: Ingenix BioResearcherはシナリオ誘導型マルチエージェントシステムで、クエリをバージョン管理されたリサーチプレイブックにマップする。
バイオリサーバーは, 単位レベルの能力, オープンエンドなバイオメディカル推論, エンドツーエンドの臨床発見にわたって評価した。
- 参考スコア(独自算出の注目度): 1.497336135403194
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Translational medicine turns underspecified development goals into evidence synthesis that must combine literature, trials, patents, and quantitative multi-omics analysis while preserving identifiers, uncertainty, and retrievable provenance. General-purpose foundation models and off-the-shelf tool-augmented or multi-agent systems are not built for this: they tend to produce single-shot answers or run open-endedly, and fall short on the auditable, scenario-specific workflows that heterogeneous biomedical sources demand. This paper introduces Ingenix BioResearcher, a scenario-guided multi-agent system that maps queries to versioned research playbooks, delegates to specialized subagents over 30+ tools and machine-learning endpoints, mixes structured database access with sandboxed code for genome-scale analyses, and applies claim-level multi-model reconciliation before editorial assembly. We evaluate BioResearcher across unit-level capabilities, open-ended biomedical reasoning, and end-to-end clinical discovery. It leads evaluated baselines on 109 single-step tests (83.49% pass rate; 0.892 average score), achieves strong biomedical benchmark performance (89.33% on BixBench-Verified-50 and the top 0.758 mean score on BaisBench Scientific Discovery), and leads on a 30-query clinical end-to-end benchmark with the highest positive hit rate (74.7% $\pm$ 3.3%) and negative clear rate (96.8% $\pm$ 0.2%). These results show broad, competitive performance across unit-level, open-ended, and end-to-end clinical evaluations.
- Abstract(参考訳): 翻訳医学は、特定されていない開発目標を、識別子、不確実性、検索可能な証明を保ちながら、文学、治験、特許、量的マルチオミクス分析を組み合わせなければならないエビデンス合成に変換する。
汎用ファウンデーションモデルとオフザシェルフツール拡張あるいはマルチエージェントシステムは、このために構築されていない。単一ショットの回答を生成したり、オープンに実行される傾向があり、異種バイオメディカルソースが要求する監査可能なシナリオ固有のワークフローに不足する。
Ingenix BioResearcherは、クエリをバージョン管理されたリサーチプレイブックにマッピングし、30以上のツールと機械学習エンドポイント上の特別なサブエージェントに委譲し、構造化データベースアクセスとサンドボックスコードとを混合してゲノムスケール解析を行い、クレームレベルのマルチモデル調整を編集組み立て前に適用するシナリオ誘導型マルチエージェントシステムである。
バイオリサーバーは, 単位レベルの能力, オープンエンドなバイオメディカル推論, エンドツーエンドの臨床発見にわたって評価した。
BixBench-Verified-50で89.33%、BaisBench Scientific Discoveryで0.758の平均スコアで0.758)の強いバイオメディカルベンチマーク性能を達成し、30クイリーの治験終末ベンチマーク(74.7%$\pm$ 3.3%)と負のクリアレート(96.8%$\pm$ 0.2%)を達成している。
これらの結果から, ユニットレベル, オープンエンド, エンドツーエンドの臨床評価において, 幅広い, 競争力のある成績を示した。
関連論文リスト
- BioMedArena: An Open-source Toolkit for Building and Evaluating Biomedical Deep Research Agents [35.04967801827194]
ディープリサーチエージェントを評価するためのオープンソースのツールキットであるBioMedArenaをリリースする。
BioMedArenaは6層のバイオメディカルエージェント評価を分離する。
147のバイオメディカルベンチマークと75のバイオメディカルツールを9つのファミリーに公開している。
論文 参考訳(メタデータ) (2026-05-07T12:57:18Z) - Health System Scale Semantic Search Across Unstructured Clinical Notes [1.599023522858371]
我々は168万人の患者から1億6600万の臨床ノートを索引付けする意味検索システムを大小児病院に展開する。
このシステムは、サブレイテンシークエリのレイテンシ(現在237msのシングルユーザ、451msの20ユーザ)を毎月約4,000米ドルのコストで提供する。
論文 参考訳(メタデータ) (2026-04-28T13:09:48Z) - BioMiner: A Multi-modal System for Automated Mining of Protein-Ligand Bioactivity Data from Literature [53.894504720119805]
生物活性データ抽出のためのマルチモーダル抽出フレームワークであるBioMinerを紹介する。
BioMinerでは、生物活性セマンティクスは直接推論によって推測され、化学構造は化学構造に基づく視覚的セマンティクス推論パラダイムによって解決される。
厳密な評価と方法開発のために,500の出版物から得られた16,457の生物活性成分からなるベンチマークを構築した。
論文 参考訳(メタデータ) (2026-04-23T10:11:56Z) - Eligibility-Aware Evidence Synthesis: An Agentic Framework for Clinical Trial Meta-Analysis [49.83108591873481]
EligMetaはエージェントフレームワークで、自動トライアル発見と、資格を意識したメタ分析を統合する。
フレームワークは、目標トライアル間の人口アライメントを反映した類似性に基づく研究重量を計算し、適性基準を構造化する。
論文 参考訳(メタデータ) (2026-04-03T03:18:50Z) - Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.62016795093786]
CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文 参考訳(メタデータ) (2026-03-23T05:46:45Z) - QuarkMedBench: A Real-World Scenario Driven Benchmark for Evaluating Large Language Models [8.050059911826338]
LLM(Large Language Models)は、標準化された医療試験に優れるが、高いスコアは、現実世界の医療クエリに対する高品質な応答に変換できないことが多い。
実世界の医療LCM評価に適した生態学的に有効なベンチマークであるQuarkMedBenchを紹介する。
論文 参考訳(メタデータ) (2026-03-14T01:51:43Z) - TriAgent: Automated Biomarker Discovery with Deep Research Grounding for Triage in Acute Care by LLM-Based Multi-Agent Collaboration [3.0416960239499358]
世界の救急医療機関は、患者数の増加、労働力不足、トリアージ決定のばらつきに直面している。
この課題に対処するために,大規模言語モデル(LLM)ベースのマルチエージェントフレームワークであるTriAgentを紹介した。
TriAgentは、バイオマーカーの自動発見と、文学的根拠による検証と新規性評価のための深い研究を結合する。
論文 参考訳(メタデータ) (2025-10-17T12:26:29Z) - BioMedSearch: A Multi-Source Biomedical Retrieval Framework Based on LLMs [8.505934574757587]
大規模言語モデル(LLM)に基づくバイオメディカル情報検索フレームワークであるBioMedSearchについて述べる。
本手法は,文献検索,タンパク質データベース,Web検索アクセスを統合し,複雑なバイオメディカルクエリの正確かつ効率的な処理を支援する。
質問応答の精度を評価するために,3,000の質問からなる多レベルデータセットBioMedMCQを構築した。
論文 参考訳(メタデータ) (2025-10-15T13:01:31Z) - An Agentic System for Rare Disease Diagnosis with Traceable Reasoning [69.46279475491164]
大型言語モデル(LLM)を用いた最初のまれな疾患診断エージェントシステムであるDeepRareを紹介する。
DeepRareは、まれな疾患の診断仮説を分類し、それぞれに透明な推論の連鎖が伴う。
このシステムは2,919の疾患に対して異常な診断性能を示し、1013の疾患に対して100%の精度を達成している。
論文 参考訳(メタデータ) (2025-06-25T13:42:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。