論文の概要: EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery
- arxiv url: http://arxiv.org/abs/2603.08127v1
- Date: Mon, 09 Mar 2026 09:07:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:15.722642
- Title: EvoScientist: Towards Multi-Agent Evolving AI Scientists for End-to-End Scientific Discovery
- Title(参考訳): EvoScientist: エンドツーエンドの科学発見のためのマルチエージェント進化型AI科学者を目指して
- Authors: Yougang Lyu, Xi Zhang, Xinhao Yi, Yuyue Zhao, Shuyu Guo, Wenxiang Hu, Jan Piotrowski, Jakub Kaliski, Jacopo Urbani, Zaiqiao Meng, Lun Zhou, Xiaohui Yan,
- Abstract要約: EvoScientistは進化するマルチエージェントAI科学者フレームワークである。
永続記憶と自己進化を通じて研究戦略を継続的に改善する。
科学的なアイデア生成において、7つのオープンソースおよび商用の最先端システムを上回っている。
- 参考スコア(独自算出の注目度): 18.348102991427965
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing adoption of Large Language Models (LLMs) has enabled AI scientists to perform complex end-to-end scientific discovery tasks requiring coordination of specialized roles, including idea generation and experimental execution. However, most state-of-the-art AI scientist systems rely on static, hand-designed pipelines and fail to adapt based on accumulated interaction histories. As a result, these systems overlook promising research directions, repeat failed experiments, and pursue infeasible ideas. To address this, we introduce EvoScientist, an evolving multi-agent AI scientist framework that continuously improves research strategies through persistent memory and self-evolution. EvoScientist comprises three specialized agents: a Researcher Agent (RA) for scientific idea generation, an Engineer Agent (EA) for experiment implementation and execution, and an Evolution Manager Agent (EMA) that distills insights from prior interactions into reusable knowledge. EvoScientist contains two persistent memory modules: (i) an ideation memory, which summarizes feasible research directions from top-ranked ideas while recording previously unsuccessful directions; and (ii) an experimentation memory, which captures effective data processing and model training strategies derived from code search trajectories and best-performing implementations. These modules enable the RA and EA to retrieve relevant prior strategies, improving idea quality and code execution success rates over time. Experiments show that EvoScientist outperforms 7 open-source and commercial state-of-the-art systems in scientific idea generation, achieving higher novelty, feasibility, relevance, and clarity via automatic and human evaluation. EvoScientist also substantially improves code execution success rates through multi-agent evolution, demonstrating persistent memory's effectiveness for end-to-end scientific discovery.
- Abstract(参考訳): LLM(Large Language Models)の採用の増加により、AI科学者はアイデア生成や実験的な実行を含む特別な役割の調整を必要とする複雑なエンドツーエンドの科学的発見タスクを実行できるようになった。
しかし、最先端のAI科学者システムのほとんどは、静的で手作業で設計されたパイプラインに依存しており、蓄積されたインタラクション履歴に基づいて適応できない。
その結果、これらのシステムは有望な研究方向を見落とし、実験を繰り返し、実現不可能なアイデアを追求した。
この問題を解決するために、永続記憶と自己進化を通じて研究戦略を継続的に改善する進化中のマルチエージェントAI科学者フレームワークであるEvoScientistを紹介します。
EvoScientistは、科学的アイデア生成のための研究者エージェント(RA)、実験と実行のためのエンジニアエージェント(EA)、事前の相互作用から再利用可能な知識に洞察を蒸留する進化管理エージェント(EMA)の3つの専門エージェントで構成されている。
EvoScientistには2つの永続メモリモジュールが含まれている。
一 先行して失敗した方向を記録しつつ、上位の考えから可能な研究方向を要約した考え記憶
(2) コード探索トラジェクトリと最良の実装から得られた効果的なデータ処理とモデルトレーニング戦略をキャプチャする実験メモリ。
これらのモジュールにより、RAとEAは関連する事前戦略を検索し、アイデアの品質とコード実行の成功率を改善することができる。
実験によると、EvoScientistは、科学的アイデア生成において、7つのオープンソースおよび商用の最先端システムより優れており、自動的および人的評価を通じて、より新規性、実現可能性、妥当性、明確性を達成する。
EvoScientistはまた、マルチエージェント進化を通じてコード実行の成功率を大幅に改善し、エンドツーエンドの科学的発見に永続的なメモリの有効性を示す。
関連論文リスト
- OR-Agent: Bridging Evolutionary Search and Structured Research for Automated Algorithm Discovery [10.217363774023033]
OR-Agentは、リッチな実験環境における自動探査のために設計されたマルチエージェントの研究フレームワークである。
本稿では,研究開始点の進化的選択,総合的な研究計画生成,研究ツリー内の協調探索を統一する進化的システム機構を提案する。
我々は古典的最適化ベンチマーク(走行セールスマン、静電容量化車両ルーティング、ビンパッキング、オリエンテーリング、および複数のクナップサック問題を含む)およびシミュレーションに基づく協調運転シナリオを含む実験を行う。
論文 参考訳(メタデータ) (2026-02-14T13:32:03Z) - Dynamic Knowledge Exchange and Dual-diversity Review: Concisely Unleashing the Potential of a Multi-Agent Research Team [53.38438460574943]
IDVSCIは、大規模言語モデル(LLM)上に構築されたマルチエージェントフレームワークである。
動的知識交換機構とデュアルダイバーシティ・レビュー・パラダイムという2つの重要なイノベーションが組み込まれている。
結果は、IDVSCIが2つのデータセットで常に最高のパフォーマンスを達成していることを示している。
論文 参考訳(メタデータ) (2025-06-23T07:12:08Z) - Many Heads Are Better Than One: Improved Scientific Idea Generation by A LLM-Based Multi-Agent System [62.832818186789545]
Virtual Scientists (VirSci) は、科学研究に固有のチームワークを模倣するために設計されたマルチエージェントシステムである。
VirSciは研究のアイデアを共同で生成し、評価し、洗練するエージェントのチームを組織している。
このマルチエージェントアプローチは、新しい科学的アイデアを生み出す上で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-12T07:16:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。