論文の概要: From Tabula Rasa to Emergent Abilities: Discovering Robot Skills via Real-World Unsupervised Quality-Diversity
- arxiv url: http://arxiv.org/abs/2508.19172v1
- Date: Tue, 26 Aug 2025 16:20:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.91636
- Title: From Tabula Rasa to Emergent Abilities: Discovering Robot Skills via Real-World Unsupervised Quality-Diversity
- Title(参考訳): タトゥーラ・ラサから創発的能力:現実世界の教師なし品質多様性によるロボットスキルの発見
- Authors: Luca Grillotti, Lisa Coiffard, Oscar Pang, Maxence Faldor, Antoine Cully,
- Abstract要約: Unsupervised Real-world Skill Acquisition (URSA)は、QDAC(Quality-Diversity Actor-Critic)の拡張である。
URSAは、ロボットが現実世界で直接、多様なハイパフォーマンスなスキルを自律的に発見し、習得することを可能にする。
本研究は,より自律的で適応性の高いロボットシステムに向けた重要なステップを示す,現実世界のロボット学習のための新しいフレームワークを構築した。
- 参考スコア(独自算出の注目度): 11.956963115619475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous skill discovery aims to enable robots to acquire diverse behaviors without explicit supervision. Learning such behaviors directly on physical hardware remains challenging due to safety and data efficiency constraints. Existing methods, including Quality-Diversity Actor-Critic (QDAC), require manually defined skill spaces and carefully tuned heuristics, limiting real-world applicability. We propose Unsupervised Real-world Skill Acquisition (URSA), an extension of QDAC that enables robots to autonomously discover and master diverse, high-performing skills directly in the real world. We demonstrate that URSA successfully discovers diverse locomotion skills on a Unitree A1 quadruped in both simulation and the real world. Our approach supports both heuristic-driven skill discovery and fully unsupervised settings. We also show that the learned skill repertoire can be reused for downstream tasks such as real-world damage adaptation, where URSA outperforms all baselines in 5 out of 9 simulated and 3 out of 5 real-world damage scenarios. Our results establish a new framework for real-world robot learning that enables continuous skill discovery with limited human intervention, representing a significant step toward more autonomous and adaptable robotic systems. Demonstration videos are available at http://adaptive-intelligent-robotics.github.io/URSA .
- Abstract(参考訳): 自律的なスキル発見は、ロボットが明確な監督なしに多様な行動を取得することを可能にすることを目的としている。
このような動作を物理ハードウェア上で直接学習することは、安全とデータ効率の制約のため、依然として困難である。
QDAC(Quality-Diversity Actor-Critic)を含む既存の手法では、手動で定義されたスキルスペースと注意深くヒューリスティックを調整し、現実の応用性を制限する必要がある。
本研究では,QDACを拡張したUnsupervised Real-world Skill Acquisition (URSA)を提案する。
URSAはシミュレーションと実世界の両方で4倍になったUnitree A1上で,多様なロコモーションスキルの発見に成功した。
提案手法はヒューリスティック駆動型スキル発見と教師なし設定の両方をサポートする。
また,実世界の被害シナリオの5つ中5つ中3つにおいてURSAが全てのベースラインを上回り,実世界の被害シナリオの3つ中3つにおいて,学習したスキルレパートリーが実世界の被害適応などの下流タスクに再利用可能であることを示す。
本研究は,より自律的で適応可能なロボットシステムに向けた重要なステップである,人間の介入を限定した継続的なスキル発見を可能にする,現実世界のロボット学習のための新しいフレームワークを構築した。
デモビデオはhttp://adaptive-intelligent-robotics.github.io/URSA で公開されている。
関連論文リスト
- Unsupervised Skill Discovery as Exploration for Learning Agile Locomotion [7.947027135724114]
SDAX(Skill Discovery as Exploration)は、人間のエンジニアリングの労力を大幅に削減する新しい学習フレームワークである。
SDAXは、クロール、クライミング、跳躍、垂直壁から飛び降りるなどの複雑な操作の実行など、四足歩行ロボットが高度にアジャイルな行動を得ることを可能にすることを実証する。
論文 参考訳(メタデータ) (2025-08-12T14:49:25Z) - Unlock Reliable Skill Inference for Quadruped Adaptive Behavior by Skill Graph [26.861541495975686]
本稿では,ロボットの基本スキルの集合を組織化するための新しいフレームワークとして,ロボットスキルグラフ(RSG)を提案する。
RSGはKGの静的知識ではなく、巨大な動的行動スキルで構成されている。
我々は,RSGが新たなタスクや環境に対して,信頼性の高いスキル推論を提供できることを示す。
論文 参考訳(メタデータ) (2023-11-10T11:59:41Z) - RH20T: A Comprehensive Robotic Dataset for Learning Diverse Skills in
One-Shot [56.130215236125224]
オープンドメインでのロボット操作における重要な課題は、ロボットの多様性と一般化可能なスキルの獲得方法である。
単発模倣学習の最近の研究は、訓練されたポリシーを実証に基づく新しいタスクに移行する可能性を示唆している。
本稿では,エージェントがマルチモーダルな知覚で数百の現実世界のスキルを一般化する可能性を解き放つことを目的とする。
論文 参考訳(メタデータ) (2023-07-02T15:33:31Z) - Stabilizing Contrastive RL: Techniques for Robotic Goal Reaching from Offline Data [96.5899286619008]
自己指導型学習は、制御戦略を学ぶのに必要な人間のアノテーションとエンジニアリングの労力を減らす可能性がある。
我々の研究は、強化学習(RL)自体が自己監督的な問題であることを示す先行研究に基づいている。
コントラスト学習に基づく自己教師付きRLアルゴリズムは,実世界の画像に基づくロボット操作タスクを解くことができることを示す。
論文 参考訳(メタデータ) (2023-06-06T01:36:56Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Online Damage Recovery for Physical Robots with Hierarchical
Quality-Diversity [3.899855581265355]
階層的行動レパートリーを用いて多様なスキルを学習する階層的試行錯誤アルゴリズムを導入する。
階層的なスキルの分解により、ロボットはより複雑な振る舞いを学習し、レパートリーの学習を学習しやすくする。
論文 参考訳(メタデータ) (2022-10-18T15:02:41Z) - Robot Skill Adaptation via Soft Actor-Critic Gaussian Mixture Models [29.34375999491465]
現実の世界で行動する自律的エージェントにとっての中核的な課題は、その騒々しい知覚とダイナミクスに対処するために、そのスキルのレパートリーを適応させることである。
ロングホライズンタスクにスキルの学習を拡大するためには、ロボットは学習し、その後、構造化された方法でスキルを洗練する必要がある。
SAC-GMMは,動的システムを通じてロボットのスキルを学習し,学習したスキルを自身の軌道分布空間に適応させる,新しいハイブリッドアプローチである。
論文 参考訳(メタデータ) (2021-11-25T15:36:11Z) - Dual-Arm Adversarial Robot Learning [0.6091702876917281]
ロボット学習のためのプラットフォームとしてデュアルアーム設定を提案する。
このセットアップの潜在的なメリットと、追求できる課題と研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-10-15T12:51:57Z) - The Ingredients of Real-World Robotic Reinforcement Learning [71.92831985295163]
実世界で収集されたデータによって継続的に自律的に改善できるロボット学習システムに必要な要素について論じる。
本稿では,このようなシステムの特異なインスタンス化を事例として,デクスタラスな操作を事例として提案する。
我々は人間の介入なしに学習できることを実証し、現実世界の3本指の手で様々な視覚ベースのスキルを習得する。
論文 参考訳(メタデータ) (2020-04-27T03:36:10Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。