論文の概要: Learning Without Losing Identity: Capability Evolution for Embodied Agents
- arxiv url: http://arxiv.org/abs/2604.07799v1
- Date: Thu, 09 Apr 2026 04:51:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.69998
- Title: Learning Without Losing Identity: Capability Evolution for Embodied Agents
- Title(参考訳): アイデンティティを失うことなく学ぶ: 身体的エージェントの能力進化
- Authors: Xue Qin, Simin Luan, John See, Cong Yang, Zhijun Li,
- Abstract要約: エンボディエージェントのための機能中心進化パラダイムを提案する。
我々はロボットが認知的アイデンティティとして永続的なエージェントを維持するべきだと主張する。
エージェントアイデンティティから機能進化を分離する統合されたフレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.412476605788482
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Embodied agents are expected to operate persistently in dynamic physical environments, continuously acquiring new capabilities over time. Existing approaches to improving agent performance often rely on modifying the agent itself -- through prompt engineering, policy updates, or structural redesign -- leading to instability and loss of identity in long-lived systems. In this work, we propose a capability-centric evolution paradigm for embodied agents. We argue that a robot should maintain a persistent agent as its cognitive identity, while enabling continuous improvement through the evolution of its capabilities. Specifically, we introduce the concept of Embodied Capability Modules (ECMs), which represent modular, versioned units of embodied functionality that can be learned, refined, and composed over time. We present a unified framework in which capability evolution is decoupled from agent identity. Capabilities evolve through a closed-loop process involving task execution, experience collection, model refinement, and module updating, while all executions are governed by a runtime layer that enforces safety and policy constraints. We demonstrate through simulated embodied tasks that capability evolution improves task success rates from 32.4% to 91.3% over 20 iterations, outperforming both agent-modification baselines and established skill-learning methods (SPiRL, SkiMo), while preserving zero policy drift and zero safety violations. Our results suggest that separating agent identity from capability evolution provides a scalable and safe foundation for long-term embodied intelligence.
- Abstract(参考訳): 身体的エージェントは、動的物理的環境において持続的に動作し、時間とともに新しい機能を継続的に獲得することが期待されている。
エージェントのパフォーマンスを改善するための既存のアプローチは、しばしばエージェント自体を変更することに依存します。
本研究では,エンボディエージェントのための機能中心進化パラダイムを提案する。
ロボットは、その能力の進化を通じて継続的な改善を図りつつ、その認知的アイデンティティとして永続的なエージェントを維持するべきであると論じる。
具体的には,Embodied Capability Modules (ECMs) の概念を導入し,モジュール型で,時間とともに学習し,洗練し,構成することができる。
エージェントアイデンティティから機能進化を分離する統合されたフレームワークを提案する。
タスク実行、エクスペリエンスコレクション、モデルリファインメント、モジュール更新を含むクローズドループプロセスを通じて、すべての実行は、安全とポリシーの制約を強制するランタイム層によって管理される。
エージェント修正ベースラインと確立されたスキルラーニング手法(SPiRL, SkiMo)の両方を上回り, ゼロポリシードリフトとゼロ安全違反を保ちながら, タスク成功率を32.4%から91.3%に向上させる実演した。
この結果から,エージェントのアイデンティティを能力進化から切り離すことが,長期的なインボディードインテリジェンスのためのスケーラブルで安全な基盤となることが示唆された。
関連論文リスト
- Your Code Agent Can Grow Alongside You with Structured Memory [6.836735626065529]
我々は,人間とAIの継続的な共進化を可能にするフレームワークであるMemCoderを提案する。
MemCoderはまず、過去のコミットから潜伏した意図-コードマッピングを蒸留するために、過去の人間の経験を構造化する。
次に、検証フィードバックによって駆動される自己リファインメントメカニズムを使用して、エージェントの動作をリアルタイムで修正する。
論文 参考訳(メタデータ) (2026-02-25T06:39:29Z) - Position: Agentic Evolution is the Path to Evolving LLMs [56.733933092220845]
この制限に対処するには、新たなスケーリング軸進化が必要です。
既存の展開時適応手法では、障害を診断し、持続的な改善を生み出すために必要な戦略的機関が欠如している。
論文 参考訳(メタデータ) (2026-01-30T22:15:58Z) - Yunjue Agent Tech Report: A Fully Reproducible, Zero-Start In-Situ Self-Evolving Agent System for Open-Ended Tasks [10.622439192272527]
従来のエージェントシステムは、タスク分布が継続的にドリフトし、外部の監視が不十分な、オープンな環境に苦しむ。
In-Situ Self-Evolving(In-Situ Self-Evolving)パラダイムを提案する。
このフレームワーク内では、新しい課題をナビゲートするためのツールを反復的に合成、最適化、再利用するシステムであるYunjue Agentを開発します。
論文 参考訳(メタデータ) (2026-01-26T07:27:47Z) - Logic-Driven Semantic Communication for Resilient Multi-Agent Systems [26.964933264412412]
6Gネットワークは、大規模な分散マルチエージェントシステムにおいて、自律性とインテリジェンスを加速している。
本稿では2つの相補的な次元に根ざしたMASレジリエンスの形式的定義を提案する。
我々はエージェントアーキテクチャを設計し、エピステミックとアクションレジリエンスの両方を達成するために分散アルゴリズムを開発する。
論文 参考訳(メタデータ) (2026-01-11T00:54:09Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - EvolveR: Self-Evolving LLM Agents through an Experience-Driven Lifecycle [26.048906477714937]
現在のLLM(Large Language Model)エージェントは、ツール使用時のパフォーマンスは高いが、自身の経験から体系的に学習する能力は欠如している。
EvolveRは、エージェントが完全なクローズドループ体験ライフサイクルを通じて自己改善できるように設計されたフレームワークである。
複雑なマルチホップ質問応答ベンチマークにおけるEvolveRの有効性を示す。
論文 参考訳(メタデータ) (2025-10-17T12:03:16Z) - From Agentification to Self-Evolving Agentic AI for Wireless Networks: Concepts, Approaches, and Future Research Directions [70.72279728350763]
自律進化型エージェント人工知能(AI)は、将来の無線システムに新しいパラダイムを提供する。
静的AIモデルとは異なり、自己進化エージェントは、モデルやツールを更新し、環境ダイナミクスに対応する自律進化サイクルを組み込む。
本稿では,自己進化型エージェントAIの概要を概説し,その階層化アーキテクチャ,ライフサイクル,鍵となる技術について述べる。
論文 参考訳(メタデータ) (2025-10-07T05:45:25Z) - A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence [87.08051686357206]
大きな言語モデル(LLM)は強力な能力を示しているが、基本的に静的である。
LLMはますますオープンでインタラクティブな環境にデプロイされているため、この静的な性質は重要なボトルネックとなっている。
この調査は、自己進化エージェントの体系的で包括的なレビューを初めて提供する。
論文 参考訳(メタデータ) (2025-07-28T17:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。