論文の概要: Think Small, Act Big: Primitive Prompt Learning for Lifelong Robot Manipulation
- arxiv url: http://arxiv.org/abs/2504.00420v1
- Date: Tue, 01 Apr 2025 04:55:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:19:44.022999
- Title: Think Small, Act Big: Primitive Prompt Learning for Lifelong Robot Manipulation
- Title(参考訳): ロボット操作のための原始的なプロンプト学習
- Authors: Yuanqi Yao, Siao Liu, Haoming Song, Delin Qu, Qizhi Chen, Yan Ding, Bin Zhao, Zhigang Wang, Xuelong Li, Dong Wang,
- Abstract要約: 本稿では,再利用可能なロボットとプリミティブを用いて,生涯にわたるロボット操作を実現するプリミティブ・プロンプト・ラーニングを提案する。
まず、マルチスキル事前学習段階を通じて、共有プリミティブを表現するプリミティブプロンプトのセットを学習する。
新しいプロンプトは、凍結した事前訓練されたプロンプトで追加され、最適化される。
- 参考スコア(独自算出の注目度): 43.350196832118215
- License:
- Abstract: Building a lifelong robot that can effectively leverage prior knowledge for continuous skill acquisition remains significantly challenging. Despite the success of experience replay and parameter-efficient methods in alleviating catastrophic forgetting problem, naively applying these methods causes a failure to leverage the shared primitives between skills. To tackle these issues, we propose Primitive Prompt Learning (PPL), to achieve lifelong robot manipulation via reusable and extensible primitives. Within our two stage learning scheme, we first learn a set of primitive prompts to represent shared primitives through multi-skills pre-training stage, where motion-aware prompts are learned to capture semantic and motion shared primitives across different skills. Secondly, when acquiring new skills in lifelong span, new prompts are appended and optimized with frozen pretrained prompts, boosting the learning via knowledge transfer from old skills to new ones. For evaluation, we construct a large-scale skill dataset and conduct extensive experiments in both simulation and real-world tasks, demonstrating PPL's superior performance over state-of-the-art methods.
- Abstract(参考訳): 継続的なスキル獲得のために、事前知識を効果的に活用できる、生涯にわたるロボットを構築することは、依然として大きな課題である。
悲惨な忘れる問題を緩和する経験リプレイやパラメータ効率の手法の成功にもかかわらず、これらの手法を鼻で適用することは、スキル間の共有プリミティブを活用するのに失敗する。
これらの課題に対処するために,PPL(Primitive Prompt Learning)を提案し,再利用可能な拡張可能なプリミティブを用いて,生涯にわたるロボット操作を実現する。
2段階の学習スキームの中では、まず、複数のスキル事前学習段階を通じて、共有プリミティブを表現するプリミティブプロンプトのセットを学習し、そこでは、動作認識プロンプトが、異なるスキルにわたって、セマンティックおよびモーション共有プリミティブをキャプチャするために学習される。
第二に、生涯にわたって新しいスキルを獲得するとき、新しいプロンプトが追加され、凍結した事前訓練されたプロンプトで最適化され、古いスキルから新しいスキルへの知識移行による学習が促進される。
評価のために、我々は大規模なスキルデータセットを構築し、シミュレーションと実世界のタスクの両方で広範な実験を行い、PPLの最先端手法よりも優れた性能を示す。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - Unsupervised Skill Discovery for Robotic Manipulation through Automatic Task Generation [17.222197596599685]
本稿では,多数の自律的タスクを解くことで構成可能な振る舞いを発見するスキル学習手法を提案する。
本手法は,ロボットが環境内の物体と連続的かつ堅牢に対話することを可能にするスキルを学習する。
学習したスキルは、シミュレーションだけでなく、本物のロボットプラットフォーム上でも、目に見えない操作タスクのセットを解決するために使用できる。
論文 参考訳(メタデータ) (2024-10-07T09:19:13Z) - Task-free Lifelong Robot Learning with Retrieval-based Weighted Local Adaptation [17.215730187681952]
従来の課題から得たデータのサブセットを格納し,学習スキルを維持するために経験的リプレイを活用することと,関連する知識を回復するために新しい検索型局所適応技術を適用することの2つの方法により活用する。
我々はまた、最も「忘れられた」スキルセグメントに集中し、効果的な知識回復を確保するために、選択的な重み付け機構も組み込んだ。
論文 参考訳(メタデータ) (2024-10-03T21:11:42Z) - LOTUS: Continual Imitation Learning for Robot Manipulation Through Unsupervised Skill Discovery [29.774700960178624]
我々は,ロボットが新しい操作タスクを継続的に,効率的に学習することを可能にする,連続的な模倣学習アルゴリズムであるLOTUSを紹介する。
継続的なスキル発見は、既存のスキルを更新して、以前のタスクを忘れないようにし、新しいタスクを解決するための新しいスキルを追加する。
総合的な実験の結果、LOTUSは最先端のベースラインを11%以上の成功率で上回っていることがわかった。
論文 参考訳(メタデータ) (2023-11-03T17:38:35Z) - Learning and Retrieval from Prior Data for Skill-based Imitation
Learning [47.59794569496233]
従来のデータから時間的に拡張された感触者スキルを抽出する,スキルベースの模倣学習フレームワークを開発した。
新規タスクの性能を著しく向上させる重要な設計選択をいくつか挙げる。
論文 参考訳(メタデータ) (2022-10-20T17:34:59Z) - Bottom-Up Skill Discovery from Unsegmented Demonstrations for
Long-Horizon Robot Manipulation [55.31301153979621]
我々は,実世界の長距離ロボット操作作業に,スキル発見による取り組みを行う。
未解決のデモンストレーションから再利用可能なスキルのライブラリを学ぶためのボトムアップアプローチを提案する。
提案手法は,多段階操作タスクにおける最先端の模倣学習手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-09-28T16:18:54Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。