論文の概要: Memento-Skills: Let Agents Design Agents
- arxiv url: http://arxiv.org/abs/2603.18743v1
- Date: Thu, 19 Mar 2026 10:45:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.096446
- Title: Memento-Skills: Let Agents Design Agents
- Title(参考訳): Memento-Skills: エージェントにエージェントを設計させる
- Authors: Huichi Zhou, Siyuan Guo, Anjie Liu, Zhongwei Yu, Ziqin Gong, Bowen Zhao, Zhixun Chen, Menglong Zhang, Yihang Chen, Jinsong Li, Runyu Yang, Qiangbin Liu, Xinlei Yu, Jianmin Zhou, Na Wang, Chunyang Sun, Jun Wang,
- Abstract要約: emphMemento-SkillsはLLMエージェントシステムである。
経験を通じて、自律的に構築し、適応し、タスク固有のエージェントを改善します。
- 参考スコア(独自算出の注目度): 18.07054416610586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce \emph{Memento-Skills}, a generalist, continually-learnable LLM agent system that functions as an \emph{agent-designing agent}: it autonomously constructs, adapts, and improves task-specific agents through experience. The system is built on a memory-based reinforcement learning framework with \emph{stateful prompts}, where reusable skills (stored as structured markdown files) serve as persistent, evolving memory. These skills encode both behaviour and context, enabling the agent to carry forward knowledge across interactions. Starting from simple elementary skills (like Web search and terminal operations), the agent continually improves via the \emph{Read--Write Reflective Learning} mechanism introduced in \emph{Memento~2}~\cite{wang2025memento2}. In the \emph{read} phase, a behaviour-trainable skill router selects the most relevant skill conditioned on the current stateful prompt; in the \emph{write} phase, the agent updates and expands its skill library based on new experience. This closed-loop design enables \emph{continual learning without updating LLM parameters}, as all adaptation is realised through the evolution of externalised skills and prompts. Unlike prior approaches that rely on human-designed agents, Memento-Skills enables a generalist agent to \emph{design agents end-to-end} for new tasks. Through iterative skill generation and refinement, the system progressively improves its own capabilities. Experiments on the \emph{General AI Assistants} benchmark and \emph{Humanity's Last Exam} demonstrate sustained gains, achieving 26.2\% and 116.2\% relative improvements in overall accuracy, respectively. Code is available at https://github.com/Memento-Teams/Memento-Skills.
- Abstract(参考訳): 本稿では, 汎用的かつ継続的に学習可能なLLMエージェントシステムである \emph{Memento-Skills を紹介し, タスク固有のエージェントを自律的に構築し, 適応し, 改善する。
システムはメモリベースの強化学習フレームワーク上に構築されており、再利用可能なスキル(構造化マークダウンファイルとして保存される)が永続的で進化するメモリとして機能する。
これらのスキルは、振る舞いとコンテキストの両方をエンコードし、エージェントが対話を通して知識を前進させることができる。
Web検索や端末操作のような単純な初等的なスキルから始めて、エージェントは \emph{Memento~2}~\cite{wang2025memento2} で導入された \emph{Read--Write Reflective Learning} メカニズムを通じて継続的に改善する。
emph{read}フェーズでは、動作訓練可能なスキルルータが、現在のステートフルプロンプトに基づいて、最も関連性の高いスキルを選択する。
このクローズドループ設計により、外的スキルとプロンプトの進化を通じて、すべての適応が実現されるため、LLMパラメータを更新せずに「emph{continual learning」を実現できる。
人間が設計したエージェントに依存する従来のアプローチとは異なり、Memento-Skillsはジェネラリストエージェントが新しいタスクに対してemph{design agent end-to-end}を指定できるようにする。
反復的なスキル生成と改善によって、システムは徐々に自身の能力を改善していく。
emph{General AI Assistants}ベンチマークと \emph{Humanity's Last Exam} の実験では、それぞれ26.2\%と116.2\%の相対的な精度向上を達成した。
コードはhttps://github.com/Memento-Teams/Memento-Skills.comで入手できる。
関連論文リスト
- SoK: Agentic Skills -- Beyond Tool Use in LLM Agents [6.356997609995175]
エージェントシステムは、より確実にロングホライゾンを実行するために、再利用可能な手続き能力、すなわちエージェントスキルに依存している。
本論文は,全ライフサイクルのスキルレイヤ(発見,実践,蒸留,貯蔵,構成,評価,更新)をマッピングする。
我々は、スキルベースのエージェントのセキュリティとガバナンスの影響を分析し、サプライチェーンのリスク、スキルペイロードによるインジェクションの促進、信頼度の高い実行をカバーします。
論文 参考訳(メタデータ) (2026-02-24T13:11:38Z) - MemSkill: Learning and Evolving Memory Skills for Self-Evolving Agents [29.375397774491887]
ほとんどのLarge Language Model (LLM) エージェントメモリシステムは、メモリを抽出するために静的で手作業で設計された小さな操作に頼っている。
textbfMemSkillは、これらの操作を学習可能で進化可能なメモリスキルとして再構成する。
論文 参考訳(メタデータ) (2026-02-02T18:53:28Z) - SCOPE: Prompt Evolution for Enhancing Agent Effectiveness [53.75986399936395]
大規模言語モデル(LLM)エージェントは、大規模で動的なコンテキストを生成する環境にますますデプロイされている。
エージェントはこのコンテキストにアクセスできますが、静的なプロンプトには効果的に管理するメカニズムがありません。
textbfSCOPE (Self-evolving Context Optimization via Prompt Evolution) を導入する。
本稿では,戦術的特異性(即時誤りの解消)と戦略的汎用性(長期原則の進化)のバランスをとるデュアルストリーム機構を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:25:05Z) - Memento: Fine-tuning LLM Agents without Fine-tuning LLMs [36.3424780932712]
本稿では,適応型大言語モデル(LLM)エージェントのための新しい学習パラダイムを提案する。
本手法は,メモリベースのオンライン強化学習により,低コストで連続的な適応を可能にする。
我々はエージェントモデルを,GAIA検証でトップ1に達するemphMementoというディープリサーチ環境でインスタンス化する。
論文 参考訳(メタデータ) (2025-08-22T07:25:30Z) - Rethinking Agent Design: From Top-Down Workflows to Bottom-Up Skill Evolution [34.66260172204154]
人間の学習過程を反映したボトムアップエージェントパラダイムを導入する。
エージェントは、試行錯誤メカニズムを探索し、成果を反映し、時間とともにスキルを抽象化することで能力を獲得する。
Slay the Spire and Civilization Vでは、エージェントが生の視覚的入力を通じて知覚し、マウスのアウトプットを介して行動する。
論文 参考訳(メタデータ) (2025-05-23T09:38:55Z) - Memento No More: Coaching AI Agents to Master Multiple Tasks via Hints Internalization [56.674356045200696]
本稿では,複雑なメモシステムや事前の高品質な実演データを必要としない,複数のタスクに対する知識とスキルを取り入れたAIエージェントの訓練手法を提案する。
このアプローチでは,エージェントが新たな経験を収集し,ヒントの形で人間から補正フィードバックを受け取り,このフィードバックを重みに組み込む,反復的なプロセスを採用している。
Llama-3をベースとしたエージェントに実装することで,数ラウンドのフィードバックの後,高度なモデルGPT-4oとDeepSeek-V3をタスクセットで性能向上させる手法の有効性を実証する。
論文 参考訳(メタデータ) (2025-02-03T17:45:46Z) - Gödel Agent: A Self-Referential Agent Framework for Recursive Self-Improvement [112.04307762405669]
G"odel AgentはG"odelマシンにインスパイアされた自己進化型フレームワークである。
G"odel Agentは、パフォーマンス、効率、一般化性において手作業によるエージェントを上回る、継続的な自己改善を実現することができる。
論文 参考訳(メタデータ) (2024-10-06T10:49:40Z) - CLIN: A Continually Learning Language Agent for Rapid Task Adaptation
and Generalization [62.0397906276669]
CLINは、複数のトライアルを継続的に改善した最初の言語ベースのエージェントである。
ゼロショットのパフォーマンスを4ポイント改善し(新しいタスクでは13)、連続的なメモリ更新によってパフォーマンスをさらに向上させることができる。
これは、凍結モデル上に構築されたエージェントのための新しいアーキテクチャを示唆している。
論文 参考訳(メタデータ) (2023-10-16T07:17:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。