論文の概要: STELLA: Self-Evolving LLM Agent for Biomedical Research
- arxiv url: http://arxiv.org/abs/2507.02004v1
- Date: Tue, 01 Jul 2025 20:52:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:14.976931
- Title: STELLA: Self-Evolving LLM Agent for Biomedical Research
- Title(参考訳): STELLA:生物医学研究のための自己進化型LDMエージェント
- Authors: Ruofan Jin, Zaixi Zhang, Mengdi Wang, Le Cong,
- Abstract要約: 本稿では,制限を克服する自己進化型AIエージェントSTELLAを紹介する。
STELLAは、自律的に自身の能力を改善するマルチエージェントアーキテクチャを採用している。
バイオメディカルベンチマークを用いて,STELLAが最先端の精度を実現することを実証した。
- 参考スコア(独自算出の注目度): 40.841136388072385
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of biomedical data, tools, and literature has created a fragmented research landscape that outpaces human expertise. While AI agents offer a solution, they typically rely on static, manually curated toolsets, limiting their ability to adapt and scale. Here, we introduce STELLA, a self-evolving AI agent designed to overcome these limitations. STELLA employs a multi-agent architecture that autonomously improves its own capabilities through two core mechanisms: an evolving Template Library for reasoning strategies and a dynamic Tool Ocean that expands as a Tool Creation Agent automatically discovers and integrates new bioinformatics tools. This allows STELLA to learn from experience. We demonstrate that STELLA achieves state-of-the-art accuracy on a suite of biomedical benchmarks, scoring approximately 26\% on Humanity's Last Exam: Biomedicine, 54\% on LAB-Bench: DBQA, and 63\% on LAB-Bench: LitQA, outperforming leading models by up to 6 percentage points. More importantly, we show that its performance systematically improves with experience; for instance, its accuracy on the Humanity's Last Exam benchmark almost doubles with increased trials. STELLA represents a significant advance towards AI Agent systems that can learn and grow, dynamically scaling their expertise to accelerate the pace of biomedical discovery.
- Abstract(参考訳): バイオメディカルデータ、ツール、文学の急速な成長は、人間の専門性を上回った断片化された研究の風景を生み出した。
AIエージェントはソリューションを提供するが、通常は静的で手動でキュレートされたツールセットに依存し、適応とスケールの能力を制限する。
本稿では、これらの制限を克服するために設計された自己進化型AIエージェントSTELLAを紹介する。
STELLAでは、推論戦略のための進化中のテンプレートライブラリと、ツール作成エージェントとして拡張された動的ツールオーシャンという、2つのコアメカニズムを通じて、独自の機能を自律的に改善するマルチエージェントアーキテクチャを採用している。
これによりSTELLAは経験から学ぶことができる。
以上の結果から,STELLAはHumanityのLast Exam: Biomedicine, LAB-Bench: DBQA で 54 %, LAB-Bench: LitQA で 63 %, 先行モデルで 最大6%の精度で, バイオメディカルベンチマークで 最先端の精度を達成できた。
例えば、HumanityのLast Examベンチマークの精度は、トライアルの増加とともにほぼ2倍になる。
STELLAは、生物医学的な発見のペースを加速するために専門知識を動的にスケーリングし、学び、成長できるAIエージェントシステムに対する大きな進歩を表している。
関連論文リスト
- ConfAgents: A Conformal-Guided Multi-Agent Framework for Cost-Efficient Medical Diagnosis [11.18347744454527]
私たちは、新しいメタレベルの進化メカニズムを通じて制限を克服する、自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
論文 参考訳(メタデータ) (2025-08-06T22:39:38Z) - SEAgent: Self-Evolving Computer Use Agent with Autonomous Learning from Experience [71.82719117238307]
本稿では,コンピュータ利用エージェントが不慣れなソフトウェアとのインタラクションを通じて進化することを可能にするエージェント型自己進化フレームワークSEAgentを提案する。
我々は、OS-World内の5つの新しいソフトウェア環境におけるSEAgentの有効性を検証する。
当社のアプローチは,競合するオープンソースCUAに比べて,11.3%から34.5%という,23.2%の大幅な改善を実現している。
論文 参考訳(メタデータ) (2025-08-06T17:58:46Z) - HealthFlow: A Self-Evolving AI Agent with Meta Planning for Autonomous Healthcare Research [16.963151914975438]
私たちは、新しいメタレベルの進化メカニズムを通じて制限を克服する、自己進化型AIエージェントであるHealthFlowを紹介します。
HealthFlowは、手続き的な成功と失敗を永続的で戦略的知識基盤に蒸留することで、独自のハイレベルな問題解決ポリシーを自律的に洗練する。
私たちの実験では、HealthFlowの自己進化アプローチが最先端のエージェントフレームワークを大幅に上回っていることを実証しています。
論文 参考訳(メタデータ) (2025-08-04T17:08:47Z) - A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [87.08051686357206]
大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2025-07-28T17:59:05Z) - SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam? [51.112225746095746]
本稿では,人間研究者をエミュレートするツール強化推論エージェントであるX-Masterを紹介する。
XマスターズはHumanity's Last Examに32.1%のスコアで最新記録を樹立した。
論文 参考訳(メタデータ) (2025-07-07T17:50:52Z) - Towards Artificial Intelligence Research Assistant for Expert-Involved Learning [64.7438151207189]
大規模言語モデル (LLMs) と大規模多モードモデル (LMMs) は科学研究における変革的ツールとして登場している。
textbfExpert-involved textbfLearning (ARIEL)のためのtextbfARtificial textbfIntelligence Research Assistantを提案する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.06771291117965]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。
Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。
私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文 参考訳(メタデータ) (2025-03-26T05:56:46Z) - BioAgents: Democratizing Bioinformatics Analysis with Multi-Agent Systems [6.668992155393883]
我々は,小言語モデルに基づくマルチエージェントシステムを提案し,バイオインフォマティクスデータに基づいて微調整し,検索拡張生成(RAG)により拡張した。
当社のシステムであるBioAgentsは,プロプライエタリなデータを用いたローカル操作とパーソナライズを可能にする。
我々は、概念ゲノミクスのタスクにおいて、人間の専門家に匹敵するパフォーマンスを観察し、コード生成能力を高めるための次のステップを提案する。
論文 参考訳(メタデータ) (2025-01-10T19:30:59Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Exploring Autonomous Agents through the Lens of Large Language Models: A Review [0.0]
大規模言語モデル(LLM)は人工知能を変革し、自律エージェントがさまざまなドメインで多様なタスクを実行できるようにしている。
彼らは多目的性、人的価値のアライメント、幻覚、評価といった課題に直面している。
AgentBench、WebArena、ToolLLMといった評価プラットフォームは、複雑なシナリオでこれらのエージェントを評価する堅牢な方法を提供します。
論文 参考訳(メタデータ) (2024-04-05T22:59:02Z) - Empowering Biomedical Discovery with AI Agents [15.125735219811268]
我々は「AI科学者」を懐疑的な学習と推論が可能なシステムとして想定する。
バイオメディカルAIエージェントは、人間の創造性と専門知識と、大規模なデータセットを分析するAIの能力を組み合わせる。
AIエージェントは、仮想細胞シミュレーション、プログラム可能な表現型の制御、細胞回路の設計、新しい治療法の開発など、幅広い領域に影響を与える可能性がある。
論文 参考訳(メタデータ) (2024-04-03T16:08:01Z) - ADVISE: AI-accelerated Design of Evidence Synthesis for Global
Development [2.6293574825904624]
本研究では、変換器(BERT)モデルからの双方向エンコーダ表現に基づくAIエージェントを開発する。
本稿では,人間とAIのハイブリッドチームによるエビデンス合成プロセスの促進効果について検討する。
その結果、BERTベースのAIエージェントを人間チームに組み込むことで、人間のスクリーニングの労力を68.5%削減できることがわかった。
論文 参考訳(メタデータ) (2023-05-02T01:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。