論文の概要: Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark
- arxiv url: http://arxiv.org/abs/2508.19005v2
- Date: Tue, 02 Sep 2025 03:28:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-03 14:24:52.700738
- Title: Building Self-Evolving Agents via Experience-Driven Lifelong Learning: A Framework and Benchmark
- Title(参考訳): 経験駆動型生涯学習による自己進化型エージェントの構築 - フレームワークとベンチマーク
- Authors: Yuxuan Cai, Yipeng Hao, Jie Zhou, Hang Yan, Zhikai Lei, Rui Zhen, Zhenhua Han, Yutao Yang, Junsong Li, Qianjun Pan, Tianyu Huai, Qin Chen, Xin Li, Kai Chen, Bo Zhang, Xipeng Qiu, Liang He,
- Abstract要約: 本稿では、自己進化エージェントを構築するためのフレームワークである、経験駆動型生涯学習(ELL)を紹介する。
ELLは、Experience Exploration、Long-term Memory、Skill Learning、Knowledge Internalizationの4つのコア原則に基づいて構築されている。
また、学生の総合的な大学旅行をシミュレートするELLのベンチマークデータセットであるStuLifeを紹介した。
- 参考スコア(独自算出の注目度): 57.59000694149105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As AI advances toward general intelligence, the focus is shifting from systems optimized for static tasks to creating open-ended agents that learn continuously. In this paper, we introduce Experience-driven Lifelong Learning (ELL), a framework for building self-evolving agents capable of continuous growth through real-world interaction. The framework is built on four core principles: (1) Experience Exploration: Agents learn through continuous, self-motivated interaction with dynamic environments, navigating interdependent tasks and generating rich experiential trajectories. (2) Long-term Memory: Agents preserve and structure historical knowledge, including personal experiences, domain expertise, and commonsense reasoning, into a persistent memory system. (3) Skill Learning: Agents autonomously improve by abstracting recurring patterns from experience into reusable skills, which are actively refined and validated for application in new tasks. (4) Knowledge Internalization: Agents internalize explicit and discrete experiences into implicit and intuitive capabilities as "second nature". We also introduce StuLife, a benchmark dataset for ELL that simulates a student's holistic college journey, from enrollment to academic and personal development, across three core phases and ten detailed sub-scenarios. StuLife is designed around three key paradigm
- Abstract(参考訳): AIが汎用インテリジェンスに向かって進むにつれ、焦点は静的タスクに最適化されたシステムから、継続的に学習するオープンエンドエージェントへとシフトしている。
本稿では,実世界のインタラクションを通じて継続的な成長が可能な自己進化型エージェントを構築するためのフレームワークである,経験駆動型生涯学習(ELL)を紹介する。
1) 経験的探索: エージェントは動的環境との継続的かつ自己動機的な相互作用を通じて学び、相互依存したタスクをナビゲートし、豊富な経験的軌道を生成する。
2) 長期記憶: エージェントは、個人経験、ドメインの専門知識、コモンセンス推論を含む歴史的知識を永続記憶システムに保存し、構造化する。
(3) スキル学習: エージェントは経験から再利用可能なスキルへと繰り返しパターンを抽象化し、自律的に改善する。
(4)知識の内在化:エージェントは明示的で離散的な体験を「第二の自然」として暗黙的で直感的な能力に内部化する。
StuLifeは、学生の総合的なカレッジコースをシミュレートし、3つのコアフェーズと10の詳細なサブシナリオにまたがって、入学から学術的、個人的開発まで、学生の総合的なカレッジジャーニーをシミュレートするベンチマークデータセットである。
StuLifeは3つの重要なパラダイムを中心に設計されている
関連論文リスト
- LifelongAgentBench: Evaluating LLM Agents as Lifelong Learners [51.518410910148816]
しかし、現在の大規模言語モデル(LLM)ベースのエージェントは、状態のままであり、時間とともに知識を蓄積または転送することができない。
LLMエージェントの生涯学習能力を体系的に評価するために設計された最初の統合ベンチマークであるLifelongAgentBenchを紹介する。
論文 参考訳(メタデータ) (2025-05-17T10:09:11Z) - SPECI: Skill Prompts based Hierarchical Continual Imitation Learning for Robot Manipulation [3.1997825444285457]
動的非構造環境における現実世界のロボット操作は、進化するオブジェクト、シーン、タスクに対して生涯の適応性を必要とする。
伝統的な模倣学習は、生涯適応に不適な静的な訓練パラダイムに依存している。
我々は,ロボット操作のための新しいエンドツーエンドの階層型CILポリシーアーキテクチャである,スキル・プロンプトに基づく階層型連続模倣学習(SPECI)を提案する。
論文 参考訳(メタデータ) (2025-04-22T03:30:38Z) - Towards LifeSpan Cognitive Systems [94.8985839251011]
複雑な環境と継続的に対話する人間のようなシステムを構築することは、いくつかの重要な課題を提示します。
我々は、この想定されたシステムをLifeSpan Cognitive System (LSCS)と呼ぶ。
LSCSの重要な特徴は、過去の経験を維持し、正確にリコールしながら、インクリメンタルで迅速な更新を行う機能である。
論文 参考訳(メタデータ) (2024-09-20T06:54:00Z) - Online Continual Learning For Interactive Instruction Following Agents [20.100312650193228]
このような学習シナリオは,ロボットエージェントが世界を探索し,知覚する上で,継続的に世界を学ぶことが求められているため,現実的ではない,と我々は主張する。
本研究では,新しい行動学習と新しい環境学習という,エンボディエージェントのための2つの連続学習環境を提案する。
論文 参考訳(メタデータ) (2024-03-12T11:33:48Z) - Recall-Oriented Continual Learning with Generative Adversarial
Meta-Model [5.710971447109951]
本稿では,安定性・塑性ジレンマに対処するリコール指向連続学習フレームワークを提案する。
人間の脳が安定性と可塑性のメカニズムを分離する能力に触発されて、私たちのフレームワークは2段階のアーキテクチャで構成されています。
我々は,新たな知識を効果的に学習するだけでなく,従来の知識の安定性も高いことを示す。
論文 参考訳(メタデータ) (2024-03-05T16:08:59Z) - LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning [64.55001982176226]
LIBEROは、ロボット操作のための生涯学習の新しいベンチマークである。
宣言的知識、手続き的知識、あるいは両者の混在を効率的に伝達する方法に焦点を当てる。
我々は、無限に多くのタスクを生成できる拡張可能な手続き生成パイプラインを開発した。
論文 参考訳(メタデータ) (2023-06-05T23:32:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。