論文の概要: Learning Directed Locomotion in Modular Robots with Evolvable
Morphologies
- arxiv url: http://arxiv.org/abs/2001.07804v1
- Date: Tue, 21 Jan 2020 23:01:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 23:26:29.708653
- Title: Learning Directed Locomotion in Modular Robots with Evolvable
Morphologies
- Title(参考訳): 進化可能な形態をもつモジュラーロボットにおける学習方向移動
- Authors: Gongjin Lan, Matteo De Carlo, Fuda van Diggelen, Jakub M. Tomczak,
Diederik M. Roijers, and A.E. Eiben
- Abstract要約: この研究は、形態学とコントローラの両方が進化する進化ロボットシステムに対する我々の関心に基づいている。
このようなシステムでは、新生児ロボットは、両親の身体のランダムな組み合わせである自身の身体を制御することを学ばなければならない。
- 参考スコア(独自算出の注目度): 11.006321791711175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We generalize the well-studied problem of gait learning in modular robots in
two dimensions. Firstly, we address locomotion in a given target direction that
goes beyond learning a typical undirected gait. Secondly, rather than studying
one fixed robot morphology we consider a test suite of different modular
robots. This study is based on our interest in evolutionary robot systems where
both morphologies and controllers evolve. In such a system, newborn robots have
to learn to control their own body that is a random combination of the bodies
of the parents. We apply and compare two learning algorithms, Bayesian
optimization and HyperNEAT. The results of the experiments in simulation show
that both methods successfully learn good controllers, but Bayesian
optimization is more effective and efficient. We validate the best learned
controllers by constructing three robots from the test suite in the real world
and observe their fitness and actual trajectories. The obtained results
indicate a reality gap that depends on the controllers and the shape of the
robots, but overall the trajectories are adequate and follow the target
directions successfully.
- Abstract(参考訳): モジュラーロボットにおける歩行学習のよく研究された問題を2次元に一般化する。
まず、特定の目標方向の移動に対処し、典型的な無向歩行を学習する。
第二に、固定されたロボット形態を研究するのではなく、異なるモジュールロボットのテストスイートを考える。
この研究は、形態学とコントローラの両方が進化する進化ロボットシステムに対する我々の関心に基づいている。
このようなシステムでは、新生児ロボットは、両親の身体のランダムな組み合わせである自身の身体を制御することを学ばなければならない。
ベイズ最適化とHyperNEATという2つの学習アルゴリズムを適用して比較する。
シミュレーション実験の結果,両手法とも優れた制御器を学習できたが,ベイズ最適化の方が効率的で効率的であることがわかった。
実世界におけるテストスイートから3つのロボットを構築し,その適合性と実際の軌道を観察することにより,最良の学習コントローラを検証する。
得られた結果は,ロボットの制御器や形状に依存する現実的なギャップを示すが,全体的な軌道は適切であり,目標方向を追従できる。
関連論文リスト
- DittoGym: Learning to Control Soft Shape-Shifting Robots [30.287452037945542]
我々は、その生涯で形態を変えることができるロボットとして定義された、再構成可能な新しいロボットを探索する。
再構成可能なソフトロボットの制御を高次元強化学習(RL)問題として定式化する。
細かな形態変化を必要とするソフトロボットのための総合的なRLベンチマークであるDittoGymを紹介する。
論文 参考訳(メタデータ) (2024-01-24T05:03:05Z) - A comparison of controller architectures and learning mechanisms for
arbitrary robot morphologies [2.884244918665901]
学習ロボットの形態が事前に分かっていない場合、ロボットコントローラと学習方法の組み合わせはどのように使うべきか。
我々は3つのコントローラとラーナーの組み合わせを実験的に比較した。
有効性、効率、堅牢性を比較します。
論文 参考訳(メタデータ) (2023-09-25T07:11:43Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - GenLoco: Generalized Locomotion Controllers for Quadrupedal Robots [87.32145104894754]
四足歩行ロボットのための汎用ロコモーション(GenLoco)コントローラを訓練するためのフレームワークを提案する。
本フレームワークは,多種多様な四足歩行ロボットに展開可能な汎用ロコモーションコントローラを合成する。
我々のモデルは、より一般的な制御戦略を取得し、新しいシミュレーションロボットや実世界のロボットに直接移行できることを示す。
論文 参考訳(メタデータ) (2022-09-12T15:14:32Z) - DayDreamer: World Models for Physical Robot Learning [142.11031132529524]
深層強化学習はロボット学習の一般的なアプローチであるが、学習するには大量の試行錯誤が必要となる。
ロボット学習の多くの進歩はシミュレータに依存している。
本稿では,Dreamerを4つのロボットに適用し,シミュレータを使わずに,オンラインおよび実世界で直接学習する。
論文 参考訳(メタデータ) (2022-06-28T17:44:48Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Evolution Gym: A Large-Scale Benchmark for Evolving Soft Robots [29.02903745467536]
ソフトロボットの設計と制御を最適化する最初の大規模ベンチマークであるEvolution Gymを提案する。
私たちのベンチマーク環境は、様々な種類の地形の移動や操作など、幅広いタスクにまたがっています。
我々は,最先端設計最適化手法と深層強化学習手法を組み合わせることで,複数のロボット共進化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-01-24T18:39:22Z) - Learning Locomotion Skills in Evolvable Robots [10.167123492952694]
本稿では,任意の形状のモジュール型ロボットが目標に向かって歩いたり,移動した場合にこの目標に従うことを学習できるようにするための,コントローラアーキテクチャと汎用学習手法を提案する。
我々のアプローチは、現実世界の3つのシナリオにおいて、クモ、ヤモリ、そしてその子孫の3つのロボットに対して検証されている。
論文 参考訳(メタデータ) (2020-10-19T14:01:50Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。