論文の概要: Evolvable Embodied Agent for Robotic Manipulation via Long Short-Term Reflection and Optimization
- arxiv url: http://arxiv.org/abs/2604.13533v2
- Date: Wed, 22 Apr 2026 06:55:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.239201
- Title: Evolvable Embodied Agent for Robotic Manipulation via Long Short-Term Reflection and Optimization
- Title(参考訳): 長期反射と最適化によるロボットマニピュレーションのための進化型身体エージェント
- Authors: Jianzong Wang, Botao Zhao, Yayun He, Junqing Peng, Xulong Zhang,
- Abstract要約: 汎用ロボットは、環境やフィードバックに基づいて適応し、進化する必要がある。
プロンプト学習は、広範囲の訓練を受けずに自己進化するロボットに新たな機会を提供する。
本稿では,環境解釈と政策計画の改善を目的とした,進化可能なエンボディエージェント(EEAgent)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 28.258548309585592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Achieving general-purpose robotics requires empowering robots to adapt and evolve based on their environment and feedback. Traditional methods face limitations such as extensive training requirements, difficulties in cross-task generalization, and lack of interpretability. Prompt learning offers new opportunities for self-evolving robots without extensive training, but simply reflecting on past experiences. However, extracting meaningful insights from task successes and failures remains a challenge. To this end, we propose the evolvable embodied agent (EEAgent) framework, which leverages large vision-language models (VLMs) for better environmental interpretation and policy planning. To enhance reflection on past experiences, we propose a long short-term reflective optimization (LSTRO) mechanism that dynamically refines prompts based on both past experiences and newly learned lessons, facilitating continuous self-evolution, thereby enhancing overall task success rates. Evaluations on six VIMA-Bench tasks reveal that our approach sets a new state-of-the-art, notably outperforming baselines in complex scenarios.
- Abstract(参考訳): 汎用ロボティクスの達成には、ロボットが環境やフィードバックに基づいて適応し、進化する権限が必要である。
従来の手法では、広範な訓練要件、クロスタスクの一般化の困難、解釈可能性の欠如といった制限に直面している。
Prompt Learningは、広範なトレーニングをすることなく、単に過去の経験を反映した自己進化型ロボットに新たな機会を提供する。
しかしながら、タスクの成功と失敗から有意義な洞察を抽出することは、依然として課題である。
そこで本研究では,環境の解釈と政策計画を改善するために,大規模視覚言語モデル(VLM)を活用する,進化可能なエンボディエージェント(EEAgent)フレームワークを提案する。
本研究では,過去の経験の反映を高めるために,過去の経験と新たな教訓の両方に基づいてプロンプトを動的に洗練し,継続的な自己進化を促進し,全体のタスク成功率を向上する,長期的リフレクティブ最適化(LSTRO)機構を提案する。
6つのVIMA-Benchタスクの評価は、我々のアプローチが新しい最先端、特に複雑なシナリオにおけるベースラインよりも優れていることを示す。
関連論文リスト
- Experiential Reflective Learning for Self-Improving LLM Agents [1.1074589887824053]
実験的反射学習(ERL:Experiential Reflective Learning)は,迅速な環境適応を実現するシンプルな自己改善フレームワークである。
ERLはタスクの軌跡と成果を反映して、タスク間で伝達される実行可能なレッスンを生成する。
ERLはReActベースラインよりも成功率を7.8%向上させ、タスク完了の信頼性を大きく向上させる。
論文 参考訳(メタデータ) (2026-03-25T11:43:22Z) - Self-Consolidation for Self-Evolving Agents [51.94826934403236]
大規模言語モデル(LLM)エージェントは静的システムとして機能し、生涯にわたる相互作用を通じて進化する能力に欠ける。
相補的進化機構を導入したLLMエージェントのための新しい自己進化フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-02T11:16:07Z) - On-the-Fly VLA Adaptation via Test-Time Reinforcement Learning [61.38273866396522]
ビジョン・ランゲージ・アクションモデルが汎用ロボット学習の強力なパラダイムとして登場した。
現在の手法は、シミュレーションや物理世界の展開に挑戦するには相変わらず適していない。
本稿では,VLA フレームワークのテスト時間強化学習について紹介する。
論文 参考訳(メタデータ) (2026-01-11T01:51:30Z) - EVOLVE-VLA: Test-Time Training from Environment Feedback for Vision-Language-Action Models [57.75717492488268]
VLA(Vision-Language-Action)モデルは、大きな言語モデルを活用することで高度なロボット操作を行う。
Supervised Finetuning (SFT) では、タスク毎の数百のデモ、厳格に軌跡を記憶すること、デプロイメント条件がトレーニングから逸脱したときに適応できないことなどが求められている。
EVOLVE-VLA(EVOLVE-VLA)は、VLAが最小またはゼロのタスク固有のデモで環境相互作用を通じて継続的に適応できるテストタイムトレーニングフレームワークである。
論文 参考訳(メタデータ) (2025-12-16T18:26:38Z) - Learning Affordances at Inference-Time for Vision-Language-Action Models [50.93181349331096]
ロボット工学において、VLA(Vision-Language-Action Model)は複雑な制御タスクを解くための有望な道を提供する。
本稿では,VLAの低レベルポリシーを過去の経験を条件とした高レベルVLMに接続するLITEN(Learning from Inference-Time Execution)を紹介する。
提案手法は,低レベルVLAの計画の生成と実行を行う推論フェーズと,その結果を反映した評価フェーズとを反復する。
論文 参考訳(メタデータ) (2025-10-22T16:43:29Z) - Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation [90.00687889213991]
複雑な長距離ロボット操作問題を解決するには、高度な高レベルの計画能力が必要である。
インターネット上で事前訓練された視覚言語モデル(VLM)は、原則としてそのような問題に対処するためのフレームワークを提供する。
本稿では,多段階操作タスクにおけるVLMの物理推論能力を高める新しいテストタイムフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-23T20:42:15Z) - A Survey on Self-Evolution of Large Language Models [116.54238664264928]
大規模言語モデル(LLM)は、様々な分野やインテリジェントエージェントアプリケーションにおいて大きく進歩している。
この問題に対処するために、LLMが自律的に獲得し、洗練し、モデル自身によって生成された経験から学ぶことができる自己進化的アプローチが急速に成長している。
論文 参考訳(メタデータ) (2024-04-22T17:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。