論文の概要: CASCADE: Cumulative Agentic Skill Creation through Autonomous Development and Evolution
- arxiv url: http://arxiv.org/abs/2512.23880v1
- Date: Mon, 29 Dec 2025 21:50:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.225302
- Title: CASCADE: Cumulative Agentic Skill Creation through Autonomous Development and Evolution
- Title(参考訳): CASCADE: 自律開発と進化による累積エージェントスキル創造
- Authors: Xu Huang, Junwu Chen, Yuxing Fei, Zhuohan Li, Philippe Schwaller, Gerbrand Ceder,
- Abstract要約: 大規模言語モデル(LLM)エージェントは現在、事前に定義されたツールや脆いツール生成に依存している。
これは、"LLM + tool use"から"LLM + skill acquisition"への移行の早期インスタンス化を表すセルフ進化型エージェントフレームワークである。
- 参考スコア(独自算出の注目度): 7.266404572341558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agents currently depend on predefined tools or brittle tool generation, constraining their capability and adaptability to complex scientific tasks. We introduce CASCADE, a self-evolving agentic framework representing an early instantiation of the transition from "LLM + tool use" to "LLM + skill acquisition". CASCADE enables agents to master complex external tools and codify knowledge through two meta-skills: continuous learning via web search and code extraction, and self-reflection via introspection and knowledge graph exploration, among others. We evaluate CASCADE on SciSkillBench, a benchmark of 116 materials science and chemistry research tasks. CASCADE achieves a 93.3% success rate using GPT-5, compared to 35.4% without evolution mechanisms. We further demonstrate real-world applications in computational analysis, autonomous laboratory experiments, and selective reproduction of published papers. Along with human-agent collaboration and memory consolidation, CASCADE accumulates executable skills that can be shared across agents and scientists, moving toward scalable AI-assisted scientific research.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは現在、事前に定義されたツールや脆いツール生成に依存しており、それらの能力と複雑な科学的タスクへの適応性を制限している。
CASCADEは「LLM + ツールの使用」から「LLM + スキル獲得」への移行の早期のインスタンス化を表す自己進化型エージェントフレームワークである。
CASCADEは、エージェントが複雑な外部ツールを習得し、Web検索とコード抽出による継続的学習と、イントロスペクションとナレッジグラフ探索による自己回帰の2つのメタスキルを通じて知識を体系化することを可能にする。
CSCADE on SciSkillBench, a benchmark of 116 materials science and chemistry research task。
CASCADEはGPT-5を用いて93.3%の成功率を達成するが、進化機構を持たないものは35.4%である。
さらに、計算分析、自律実験実験、出版論文の選択的複製における実世界の応用を実証する。
ヒューマンエージェントのコラボレーションとメモリ統合に加えて、CASCADEはエージェントや科学者間で共有できる実行可能なスキルを蓄積し、スケーラブルなAI支援科学研究へと移行する。
関連論文リスト
- Bohrium + SciMaster: Building the Infrastructure and Ecosystem for Agentic Science at Scale [82.20980951765891]
エージェントサイエンスのスケーリングにはインフラストラクチャ・アンド・エコシステムアプローチが必要である,と我々は主張する。
BohriumはAI4S資産のマネージドでトレース可能なハブとして機能し、多様な科学データ、ソフトウェア、計算、実験室のシステムをエージェント対応の能力に変換する。
SciMasterはこれらの機能を長い水平科学に編成し、科学エージェントを合成して実行することができる。
論文 参考訳(メタデータ) (2025-12-23T16:04:41Z) - An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - AstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suite [75.58737079136942]
本稿では,AstaBenchについて紹介する。AstaBenchは,科学的研究を行うためのエージェント能力の総合的な測定を行うスイートである。
私たちのスイートには、プロダクショングレードの検索ツールを備えた、最初の科学研究環境が付属しています。
22のエージェントクラスで57のエージェントを評価したところ,いくつかの興味深い結果が得られた。
論文 参考訳(メタデータ) (2025-10-24T17:10:26Z) - Democratizing AI scientists using ToolUniverse [32.32301676392716]
ゲノム学において、統合された生態系は、相互運用、再利用、およびコミュニティ主導の開発を可能にすることによって研究を変革してきた。
ToolUniverseは、オープンウェイトモデルとクローズドウェイトモデルにまたがるあらゆる言語や推論モデルからAI科学者を構築するエコシステムです。
論文 参考訳(メタデータ) (2025-09-27T17:38:53Z) - SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration [39.43814195462455]
SciToolAgentは生物学、化学、材料科学にまたがる何百もの科学ツールを自動化する。
エージェントはまた、責任と倫理的ツールの使用を保証するために、包括的な安全チェックモジュールも組み込んでいる。
論文 参考訳(メタデータ) (2025-07-27T13:55:35Z) - SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam? [51.112225746095746]
本稿では,人間研究者をエミュレートするツール強化推論エージェントであるX-Masterを紹介する。
XマスターズはHumanity's Last Examに32.1%のスコアで最新記録を樹立した。
論文 参考訳(メタデータ) (2025-07-07T17:50:52Z) - STELLA: Self-Evolving LLM Agent for Biomedical Research [40.841136388072385]
本稿では,制限を克服する自己進化型AIエージェントSTELLAを紹介する。
STELLAは、自律的に自身の能力を改善するマルチエージェントアーキテクチャを採用している。
バイオメディカルベンチマークを用いて,STELLAが最先端の精度を実現することを実証した。
論文 参考訳(メタデータ) (2025-07-01T20:52:01Z) - Kolb-Based Experiential Learning for Generalist Agents with Human-Level Kaggle Data Science Performance [81.05882480184587]
本稿では,自律エージェントに対するVygotskyのZPDを用いて,Kolbの学習サイクルの計算フレームワークを提案する。
Agent Kは、KolbとVygotskyにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
金9個、銀8個、銅12個で、メダル獲得競争で金4個、銀4個を含む。エージェントKは、コルブとヴィーゴツキーにインスパイアされた人間の認知学習をうまく統合する第1のAIシステムである。
論文 参考訳(メタデータ) (2024-11-05T23:55:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。