論文の概要: Hierarchical Quality-Diversity for Online Damage Recovery
- arxiv url: http://arxiv.org/abs/2204.05726v1
- Date: Tue, 12 Apr 2022 11:44:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-13 19:27:58.318611
- Title: Hierarchical Quality-Diversity for Online Damage Recovery
- Title(参考訳): オンライン損傷回復のための階層的品質多様性
- Authors: Maxime Allard, Sim\'on C. Smith, Konstantinos Chatzilygeroudis,
Antoine Cully
- Abstract要約: 階層的行動レパートリーを用いて多様なスキルを学習する階層的試行錯誤アルゴリズムを導入する。
階層的なスキルの分解により、ロボットはより複雑な振る舞いを学習し、レパートリーの学習を学習しやすくする。
- 参考スコア(独自算出の注目度): 1.376408511310322
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptation capabilities, like damage recovery, are crucial for the deployment
of robots in complex environments. Several works have demonstrated that using
repertoires of pre-trained skills can enable robots to adapt to unforeseen
mechanical damages in a few minutes. These adaptation capabilities are directly
linked to the behavioural diversity in the repertoire. The more alternatives
the robot has to execute a skill, the better are the chances that it can adapt
to a new situation. However, solving complex tasks, like maze navigation,
usually requires multiple different skills. Finding a large behavioural
diversity for these multiple skills often leads to an intractable exponential
growth of the number of required solutions. In this paper, we introduce the
Hierarchical Trial and Error algorithm, which uses a hierarchical behavioural
repertoire to learn diverse skills and leverages them to make the robot more
adaptive to different situations. We show that the hierarchical decomposition
of skills enables the robot to learn more complex behaviours while keeping the
learning of the repertoire tractable. The experiments with a hexapod robot show
that our method solves maze navigation tasks with 20% less actions in the most
challenging scenarios than the best baseline while having 57% less complete
failures.
- Abstract(参考訳): 損傷回復のような適応能力は、複雑な環境へのロボットの配備に不可欠である。
いくつかの研究は、事前訓練されたスキルのレパートリーを使うことで、ロボットが数分間で予期せぬ機械的損傷に適応できることを示した。
これらの適応能力はレパートリーの行動多様性に直接関連している。
ロボットがスキルを実行しなければならない選択肢が多ければ多いほど、新しい状況に適応できる可能性は高くなる。
しかし、迷路ナビゲーションのような複雑なタスクを解決するには、通常複数の異なるスキルが必要である。
これらの複数のスキルに対する大きな行動の多様性を見つけることは、しばしば必要なソリューションの数を指数関数的に増加させる。
本稿では,階層的行動レパートリーを用いて多様なスキルを学習し,それらを活用して,ロボットをさまざまな状況に適応させる階層的試行錯誤アルゴリズムを提案する。
階層的なスキルの分解により、ロボットはより複雑な振る舞いを学習し、レパートリーの学習を学習しやすくする。
ヘキサポッドロボットを用いた実験により,本手法は,最高のベースラインよりも20%少ない動作で迷路ナビゲーションタスクを解くと同時に,57%の障害を回避できることがわかった。
関連論文リスト
- Never-Ending Embodied Robot Learning [41.06748273499587]
NBCagentは、エンボディロボットのためのNever-ending Behavior-Cloningエージェントである。
スキル特化属性とスキル共有属性から、新しいロボット操作スキルの観察知識を学ぶ。
論文 参考訳(メタデータ) (2024-03-01T07:51:29Z) - RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid
Hierarchical Learning for Solving Complex Sequential Tasks [70.69063219750952]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - RoboCat: A Self-Improving Generalist Agent for Robotic Manipulation [33.10577695383743]
ロボット操作のためのマルチタスク汎用エージェントRoboCatを提案する。
このデータは、シミュレートされた本物のロボットアームから、さまざまな観察とアクションのセットでモーターコントロールスキルの大規模なレパートリーにまたがる。
RoboCatでは、ゼロショットだけでなく、100-1000例のみを用いて適応することで、新しいタスクやロボットに一般化する能力を実証する。
論文 参考訳(メタデータ) (2023-06-20T17:35:20Z) - Online Damage Recovery for Physical Robots with Hierarchical
Quality-Diversity [3.899855581265355]
階層的行動レパートリーを用いて多様なスキルを学習する階層的試行錯誤アルゴリズムを導入する。
階層的なスキルの分解により、ロボットはより複雑な振る舞いを学習し、レパートリーの学習を学習しやすくする。
論文 参考訳(メタデータ) (2022-10-18T15:02:41Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Adaptation of Quadruped Robot Locomotion with Meta-Learning [64.71260357476602]
本研究では,多岐にわたる移動課題を解くロボットの訓練にメタ強化学習を用いることを実証する。
メタトレーニングロボットのパフォーマンスは、単一のタスクでトレーニングされたロボットと似ている。
論文 参考訳(メタデータ) (2021-07-08T10:37:18Z) - Discovering Generalizable Skills via Automated Generation of Diverse
Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。
教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。
生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。
学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文 参考訳(メタデータ) (2021-06-26T03:41:51Z) - SKID RAW: Skill Discovery from Raw Trajectories [23.871402375721285]
すべてのスキルではなく、完全なタスクの実行を示すことが望ましい。
軌跡を反復パターンに分割することを同時に学習する新しい手法を提案する。
このアプローチは、スキルのシーケンスを理解するのに使用できるスキルコンディショニングを学習する。
論文 参考訳(メタデータ) (2021-03-26T17:27:13Z) - Hierarchical Affordance Discovery using Intrinsic Motivation [69.9674326582747]
本研究では,移動ロボットの価格学習を支援するために,本質的なモチベーションを用いたアルゴリズムを提案する。
このアルゴリズムは、事前にプログラムされたアクションなしで、相互に関連のある価格を自律的に発見し、学習し、適応することができる。
一度学習すると、これらの余裕はアルゴリズムによって様々な困難を伴うタスクを実行するために一連のアクションを計画するために使われる。
論文 参考訳(メタデータ) (2020-09-23T07:18:21Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。