論文の概要: You Live More Than Once: Towards Hierarchical Skill Meta-Evolving
- arxiv url: http://arxiv.org/abs/2605.28390v1
- Date: Wed, 27 May 2026 12:26:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.043253
- Title: You Live More Than Once: Towards Hierarchical Skill Meta-Evolving
- Title(参考訳): 昔より生きてきた人は、階層的なスキルのメタ進化を目指す
- Authors: Xujun Li, Kehan Zheng, Mingyuan Zhao, Yize Geng, Jinfeng Zhou, Qi Zhu, Fei Mi, Lifeng Shang, Minlie Huang, Hongning Wang,
- Abstract要約: テストタイムスキルの進化はエージェントシステムを強化するための新しいパラダイムと見なされている。
エージェントシステムの継続的改善には,スキル進化フレームワークの試験時間改善が不可欠であることを示す。
軽量な階層型スキルメタ進化ソリューションであるHiSMEを提案する。
- 参考スコア(独自算出の注目度): 92.6633152185458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Test-time skill evolving is regarded as a new paradigm for enhancing deployed agentic systems. Existing works mainly focus on hard-coded skill evolving strategies or parametric learning that rely on expensive parameter updates in the underlying LLMs. In this paper, we demonstrate that test-time refinement of the skill evolving framework itself is necessary for continuous improvement of the agent systems in different downstream scenarios, and lightweight algorithmic adaptation is feasible. Specifically, we propose HiSME, a lightweight hierarchical skill meta-evolving solution that jointly optimizes skills and the skill evolving strategy by learning meta-skills from agents' task execution traces. Experiments on diverse agentic benchmarks show that meta-evolving can produce a higher-quality skill library than pure skill evolving and can derive diverse meta-skills for different scenarios, thereby facilitating future continual experience learning. Our code is temporarily public at https://anonymous.4open.science/r/HiSME-BD45.
- Abstract(参考訳): テストタイムスキルの進化は、デプロイされたエージェントシステムの強化のための新しいパラダイムとみなされる。
既存の作業は主に、基盤となるLLMの高価なパラメータ更新に依存する、ハードコードされたスキル進化戦略やパラメトリック学習に重点を置いている。
本稿では、異なる下流シナリオにおけるエージェントシステムの継続的改善には、スキル進化フレームワーク自体のテスト時間改善が必要であり、軽量なアルゴリズム適応が実現可能であることを実証する。
具体的には、エージェントのタスク実行トレースからメタスキルを学習することで、スキルとスキル進化戦略を共同で最適化する、軽量な階層的スキルメタ進化ソリューションであるHiSMEを提案する。
多様なエージェントベンチマークの実験では、メタ進化は純粋なスキル進化よりも高品質なスキルライブラリを生み出すことができ、さまざまなシナリオの多様なメタスキルを導き出すことができ、将来の継続的な経験学習を容易にすることが示されている。
私たちのコードはhttps://anonymous.4open.science/r/HiSME-BD45で一時的に公開されています。
関連論文リスト
- MetaClaw: Just Talk -- An Agent That Meta-Learns and Evolves in the Wild [74.7263562191605]
大規模言語モデル(LLM)エージェントは、複雑なタスクにますます使われている。
既存の方法は、知識を蒸留せずに生の軌跡を保存するか、静的なスキルライブラリを維持するか、または再訓練のために破壊的なダウンタイムを必要とする。
本稿では,基本的なLCMポリシと再利用可能な行動スキルのライブラリを共同で進化させるメタ学習フレームワークであるMetaClawを紹介する。
論文 参考訳(メタデータ) (2026-03-17T22:30:30Z) - SkillRL: Evolving Agents via Recursive Skill-Augmented Reinforcement Learning [83.98129545309277]
生経験と政策改善のギャップを埋めるフレームワークであるSkillRLを提案する。
本手法では,階層型スキルライブラリであるSkillBankを構築するために,経験に基づく蒸留機構を導入する。
ALF、WebShop、および7つの検索強化タスクの実験結果は、SkillRLが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-09T03:17:17Z) - Towards AGI A Pragmatic Approach Towards Self Evolving Agent [0.0]
大規模言語モデル(LLM)ベースのエージェントは、デプロイ後、強力だが基本的に静的である。
本研究では,Base LLM,運用SLMエージェント,Code-Generation LLM,Teacher-LLMを統合した階層的自己進化型マルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-15T20:43:44Z) - Skill Expansion and Composition in Parameter Space [17.016614374151747]
Parametric Skill Expansion and Composition (PSEC)はエージェントの能力を反復的に進化させるように設計された新しいフレームワークである。
PSECは、事前知識を活用して、新しい課題に効果的に取り組む能力が優れている。
論文 参考訳(メタデータ) (2025-02-09T15:22:38Z) - MetaModulation: Learning Variational Feature Hierarchies for Few-Shot
Learning with Fewer Tasks [63.016244188951696]
本稿では,タスクを減らした少数ショット学習手法を提案する。
メタトレーニングタスクを増やすために、さまざまなバッチレベルでパラメータを変更します。
また,変分法を取り入れた学習的変分特徴階層も導入する。
論文 参考訳(メタデータ) (2023-05-17T15:47:47Z) - Meta-Learning Parameterized Skills [12.845774297648738]
本稿では,伝達可能なパラメータ化スキルを学習し,それらを新しいアクション空間に合成することを目的とした,新しいスキル学習アルゴリズムを提案する。
本研究では,提案アルゴリズムによってエージェントが難易度の高い長期作業(障害物コースとロボット操作)を解くことができることを実証的に実証する。
論文 参考訳(メタデータ) (2022-06-07T21:30:58Z) - On the Effectiveness of Fine-tuning Versus Meta-reinforcement Learning [71.55412580325743]
本稿では,新しいタスクを微調整したマルチタスク事前学習がメタテスト時間適応によるメタ事前学習と同等かそれ以上に機能することを示す。
マルチタスク事前学習はメタRLよりもシンプルで計算的に安価である傾向があるため、これは将来の研究を奨励している。
論文 参考訳(メタデータ) (2022-06-07T13:24:00Z) - Bootstrapped Meta-Learning [48.017607959109924]
本稿では,メタ学習者が自らを教えることによって,メタ最適化問題に挑戦するアルゴリズムを提案する。
アルゴリズムはまずメタラーナーからターゲットをブートストラップし、選択した(擬似)測度の下でそのターゲットまでの距離を最小化することでメタラーナーを最適化する。
我々は、Atari ALEベンチマークでモデルフリーエージェントの新たな最先端技術を実現し、数ショットの学習においてMAMLを改善し、我々のアプローチがいかに新しい可能性を開くかを実証する。
論文 参考訳(メタデータ) (2021-09-09T18:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。