論文の概要: Cross-Disciplinary Knowledge Retrieval and Synthesis: A Compound AI Architecture for Scientific Discovery
- arxiv url: http://arxiv.org/abs/2511.18298v1
- Date: Sun, 23 Nov 2025 05:33:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.756765
- Title: Cross-Disciplinary Knowledge Retrieval and Synthesis: A Compound AI Architecture for Scientific Discovery
- Title(参考訳): 学際的知識検索と合成:科学発見のための複合AIアーキテクチャ
- Authors: Svitlana Volkova, Peter Bautista, Avinash Hiriyanna, Gabriel Ganberg, Isabel Erickson, Zachary Klinefelter, Nick Abele, Hsien-Te Kao, Grant Engberson,
- Abstract要約: BioSageは、LLMをRAGと統合した新しい複合AIアーキテクチャで、AI、データサイエンス、バイオメディカル、バイオセキュリティドメインにわたる発見を可能にするために、特殊なエージェントとツールを編成した。
本システムでは,クエリ計画と応答合成を備えた検索エージェントを含む,複数の特殊エージェントを特徴とし,引用支援型応答を持つドメイン間の知識検索を実現する。
我々の研究は、チャート、表、構造化された科学データに対するマルチモーダル検索と推論に重点を置いており、また、クロスディシプリナ発見のための総合的なマルチモーダルベンチマークも開発している。
- 参考スコア(独自算出の注目度): 1.5143261755366868
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The exponential growth of scientific knowledge has created significant barriers to cross-disciplinary knowledge discovery, synthesis and research collaboration. In response to this challenge, we present BioSage, a novel compound AI architecture that integrates LLMs with RAG, orchestrated specialized agents and tools to enable discoveries across AI, data science, biomedical, and biosecurity domains. Our system features several specialized agents including the retrieval agent with query planning and response synthesis that enable knowledge retrieval across domains with citation-backed responses, cross-disciplinary translation agents that align specialized terminology and methodologies, and reasoning agents that synthesize domain-specific insights with transparency, traceability and usability. We demonstrate the effectiveness of our BioSage system through a rigorous evaluation on scientific benchmarks (LitQA2, GPQA, WMDP, HLE-Bio) and introduce a new cross-modal benchmark for biology and AI, showing that our BioSage agents outperform vanilla and RAG approaches by 13\%-21\% powered by Llama 3.1. 70B and GPT-4o models. We perform causal investigations into compound AI system behavior and report significant performance improvements by adding RAG and agents over the vanilla models. Unlike other systems, our solution is driven by user-centric design principles and orchestrates specialized user-agent interaction workflows supporting scientific activities including but not limited to summarization, research debate and brainstorming. Our ongoing work focuses on multimodal retrieval and reasoning over charts, tables, and structured scientific data, along with developing comprehensive multimodal benchmarks for cross-disciplinary discovery. Our compound AI solution demonstrates significant potential for accelerating scientific advancement by reducing barriers between traditionally siloed domains.
- Abstract(参考訳): 科学知識の指数関数的な成長は、学際的な知識発見、合成、研究協力に重大な障壁を生み出している。
この課題に対応するために、私たちは、AI、データサイエンス、バイオメディカル、バイオセキュリティドメインにわたる発見を可能にするための特殊なエージェントとツールを編成した、LLMとRAGを統合する、新しい複合AIアーキテクチャであるBioSageを紹介します。
本システムでは,クエリ計画と応答合成を行う検索エージェント,専門用語と方法論を整合させたクロスディシプリナ翻訳エージェント,透過性,トレーサビリティ,ユーザビリティを備えたドメイン固有の洞察を合成する推論エージェントなど,いくつかの特殊エージェントを特徴とする。
我々は,科学ベンチマーク(LitQA2,GPQA,WMDP,HLE-Bio)の厳密な評価によるバイオセージシステムの有効性を実証し,バイオセージエージェントが,Llama 3.1を動力とするバニラとRAGのアプローチを13~21パーセント上回ることを示す。
70BおよびGPT-4oモデル。
我々は,複合AIシステムの動作に関する因果調査を行い,バニラモデルにRAGとエージェントを追加することにより,大幅な性能向上を報告した。
他のシステムとは異なり、私たちのソリューションはユーザ中心の設計原則によって駆動され、要約や研究討論、ブレインストーミングなど、科学的な活動をサポートする特殊なユーザエージェントインタラクションワークフローを編成します。
我々の研究は、チャート、表、構造化された科学データに対するマルチモーダル検索と推論に重点を置いており、また、クロスディシプリナ発見のための総合的なマルチモーダルベンチマークも開発している。
我々の複合AIソリューションは、伝統的にサイロ化されたドメイン間の障壁を減らし、科学的進歩を加速させる重要な可能性を示している。
関連論文リスト
- SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - AgenticSciML: Collaborative Multi-Agent Systems for Emergent Discovery in Scientific Machine Learning [0.0]
AgenticSciMLは、10以上の専門AIエージェントが協力してSciMLソリューションを提案し、批判し、洗練する、協調的なマルチエージェントシステムである。
このフレームワークは、構造化された議論、検索強化されたメソッドメモリ、およびアンサンブル誘導された進化的検索を統合する。
その結果,AIエージェント間の協調推論は,創発的な方法論的革新をもたらす可能性が示唆された。
論文 参考訳(メタデータ) (2025-11-10T16:06:33Z) - AI Agents in Drug Discovery [1.9777700354742123]
エージェントAIシステムは、多様なバイオメディカルデータを統合し、タスクを実行し、ロボットプラットフォームを介して実験を行い、クローズドループで仮説を反復的に洗練することができる。
エージェントAIアーキテクチャの概念的および技術的概要は、ReAct、Reflection、Supervisor、Swarmシステムまで様々である。
文献合成,毒性予測,自動プロトコル生成,小分子合成,薬物再資源化,エンドツーエンド意思決定など,薬物発見の重要な段階にまたがる応用について解説する。
論文 参考訳(メタデータ) (2025-10-31T03:07:14Z) - Biomedical reasoning in action: Multi-agent System for Auditable Biomedical Evidence Synthesis [19.14228623181563]
バイオメディカル領域における透明でエージェントベースの推論とエビデンス統合のための実証システムであるM-Reasonについて述べる。
M-Reasonは、大規模言語モデル(LLM)とモジュールエージェントオーケストレーションの最近の進歩を活用して、様々なバイオメディカルデータソース間のエビデンス検索、評価、合成を自動化する。
オープンでインタラクティブなユーザインターフェースにより、研究者はマルチエージェントワークフローを直接観察し、調査し、評価することができる。
論文 参考訳(メタデータ) (2025-10-06T19:57:29Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Dynamic Knowledge Exchange and Dual-diversity Review: Concisely Unleashing the Potential of a Multi-Agent Research Team [53.38438460574943]
IDVSCIは、大規模言語モデル(LLM)上に構築されたマルチエージェントフレームワークである。
動的知識交換機構とデュアルダイバーシティ・レビュー・パラダイムという2つの重要なイノベーションが組み込まれている。
結果は、IDVSCIが2つのデータセットで常に最高のパフォーマンスを達成していることを示している。
論文 参考訳(メタデータ) (2025-06-23T07:12:08Z) - Deep Research Agents: A Systematic Examination And Roadmap [109.53237992384872]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - m-KAILIN: Knowledge-Driven Agentic Scientific Corpus Distillation Framework for Biomedical Large Language Models Training [22.996230737442254]
バイオメディカルな大規模言語モデル(LLM)のためのコーパスヘッダーは、オープンソースの科学コーパスにおいて、不十分な量と品質のプレス課題に対処しようとしている。
本稿では, バイオメディカル領域におけるLLMトレーニングに適した, 科学的コーパス蒸留のための知識駆動型エージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-28T08:18:24Z) - Large Language Model Agent: A Survey on Methodology, Applications and Challenges [88.3032929492409]
大きな言語モデル(LLM)エージェントは、目標駆動の振る舞いと動的適応能力を持ち、人工知能への重要な経路を示す可能性がある。
本調査は, LLMエージェントシステムを方法論中心の分類法により体系的に分解する。
私たちの作業は、エージェントの構築方法、コラボレーション方法、時間の経過とともにどのように進化するか、という、統一されたアーキテクチャの視点を提供します。
論文 参考訳(メタデータ) (2025-03-27T12:50:17Z) - BioRAG: A RAG-LLM Framework for Biological Question Reasoning [14.05505988436551]
本稿では,Large Language Models (LLMs) フレームワークを組み込んだ新規な検索拡張生成(RAG)であるBioRAGを紹介する。
このアプローチは、基本的な知識として2200万の科学論文を解析、索引付け、セグメント化することから始まり、続いて、このドメインに適した特別な埋め込みモデルをトレーニングします。
最新の情報を必要とするクエリに対して、BioRAGは質問を分解し、検索エンジンに組み込まれた反復的な検索プロセスを用いてステップバイステップの推論を行う。
論文 参考訳(メタデータ) (2024-08-02T08:37:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。