論文の概要: Hierarchical Decentralized Deep Reinforcement Learning Architecture for
a Simulated Four-Legged Agent
- arxiv url: http://arxiv.org/abs/2210.08003v1
- Date: Wed, 21 Sep 2022 07:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 21:02:18.180326
- Title: Hierarchical Decentralized Deep Reinforcement Learning Architecture for
a Simulated Four-Legged Agent
- Title(参考訳): 模擬四脚エージェントのための階層型分散深層強化学習アーキテクチャ
- Authors: W. Zai El Amri and L. Hermes and M. Schilling
- Abstract要約: 自然界では、運動の制御は階層的で分散的な方法で起こる。
そこで本研究では,シミュレートされた脚型エージェントを制御するための,分散型階層型アーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Legged locomotion is widespread in nature and has inspired the design of
current robots. The controller of these legged robots is often realized as one
centralized instance. However, in nature, control of movement happens in a
hierarchical and decentralized fashion. Introducing these biological design
principles into robotic control systems has motivated this work. We tackle the
question whether decentralized and hierarchical control is beneficial for
legged robots and present a novel decentral, hierarchical architecture to
control a simulated legged agent. Three different tasks varying in complexity
are designed to benchmark five architectures (centralized, decentralized,
hierarchical and two different combinations of hierarchical decentralized
architectures). The results demonstrate that decentralizing the different
levels of the hierarchical architectures facilitates learning of the agent,
ensures more energy efficient movements as well as robustness towards new
unseen environments. Furthermore, this comparison sheds light on the importance
of modularity in hierarchical architectures to solve complex goal-directed
tasks. We provide an open-source code implementation of our architecture
(https://github.com/wzaielamri/hddrl).
- Abstract(参考訳): レッグド・ロコモーションは自然界に広まり、現在のロボットの設計に影響を与えた。
これらの脚付きロボットのコントローラーは、しばしば1つの集中型インスタンスとして実現される。
しかし、自然界では、運動の制御は階層的で分散的な方法で起こる。
これらの生物学的設計原則をロボット制御システムに導入することが、この研究の動機となった。
本稿では, 分散型・階層型制御が脚ロボットにとって有益かどうかを問うとともに, 模擬脚型エージェントを制御するための, 分散型・階層型アーキテクチャを提案する。
複雑性の異なる3つのタスクは、5つのアーキテクチャ(分散、分散、階層、階層的アーキテクチャの2つの異なる組み合わせ)をベンチマークするように設計されている。
その結果,階層型アーキテクチャの異なるレベルを分散化することでエージェントの学習が容易になり,エネルギー効率が向上し,新たな未知環境へのロバスト性も向上した。
さらに、この比較は、複雑な目標指向タスクを解決するために階層アーキテクチャにおけるモジュラリティの重要性に光を当てている。
アーキテクチャのオープンソースコード実装(https://github.com/wzaielamri/hddrl)を提供しています。
関連論文リスト
- EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [54.99121380536659]
眼球運動バイオメトリックスは、高い安全性の識別により注目されている。
深層学習(DL)モデルは近年,眼球運動認識に成功している。
DLアーキテクチャはまだ人間の事前知識によって決定されている。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
論文 参考訳(メタデータ) (2024-09-22T13:11:08Z) - Body Transformer: Leveraging Robot Embodiment for Policy Learning [51.531793239586165]
ボディートランスフォーマー(ボディートランスフォーマー、Body Transformer、BoT)は、学習プロセスを導く誘導バイアスを提供することで、ロボットの体現性を活用するアーキテクチャである。
我々はロボットの体をセンサーとアクチュエータのグラフとして表現し、建築全体を通してプール情報にマスキングされた注意を頼りにしている。
結果として得られるアーキテクチャは、バニラ変換器と古典的な多層パーセプトロンを、タスク完了、スケーリング特性、計算効率の点で上回る。
論文 参考訳(メタデータ) (2024-08-12T17:31:28Z) - Hierarchical learning control for autonomous robots inspired by central nervous system [7.227887302864789]
本稿では,中枢神経系の階層構造を模倣した新しい階層型学習制御フレームワークを提案する。
このフレームワークは、アクティブな制御システムとパッシブな制御システムを組み合わせて、制御システムの柔軟性と信頼性の両方を改善する。
本研究は,中枢神経系における自律行動を支配する原理を明らかにし,階層的制御手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-08-07T03:24:59Z) - Hierarchical generative modelling for autonomous robots [8.023920215148486]
人型ロボットが、移動、操作、把握の全体的利用を必要とする複雑なタスクを自律的に完了できることを示します。
具体的には、箱を回収して輸送し、ドアを通り抜けて目的地に到達し、接近し、サッカーを蹴ることのできるヒューマノイドロボットの能力を示すとともに、身体の損傷や地面の不規則性の存在下で頑健な性能を示す。
論文 参考訳(メタデータ) (2023-08-15T13:51:03Z) - A Framework for Real-World Multi-Robot Systems Running Decentralized
GNN-Based Policies [4.40401067183266]
グラフニューラルネットワーク(GNN)は、複雑なマルチエージェント動作の学習を容易にするパラダイムシフト型ニューラルネットワークである。
最近の研究は、群れ、マルチエージェントパス計画、協調的カバレッジといったタスクにおいて顕著なパフォーマンスを示している。
本稿では,GNN ベースのポリシーの完全分散実行を可能にするシステムの設計について述べる。
論文 参考訳(メタデータ) (2021-11-02T17:53:54Z) - Graph Neural Networks for Decentralized Multi-Robot Submodular Action
Selection [101.38634057635373]
ロボットがチームサブモジュールの目的を最大化するために共同で行動を選択する必要があるアプリケーションに焦点を当てる。
分散通信によるサブモジュール化に向けた汎用学習アーキテクチャを提案する。
大規模ロボットネットワークによるアクティブターゲットカバレッジのシナリオにおいて、GNNベースの学習アプローチのパフォーマンスを実証します。
論文 参考訳(メタデータ) (2021-05-18T15:32:07Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep Imitation Learning for Bimanual Robotic Manipulation [70.56142804957187]
本稿では,ロボットによるバイマニュアル操作のための深層模倣学習フレームワークを提案する。
中心となる課題は、操作スキルを異なる場所にあるオブジェクトに一般化することである。
i)マルチモーダルダイナミクスを要素運動プリミティブに分解し、(ii)リカレントグラフニューラルネットワークを用いて各プリミティブをパラメータ化して相互作用を捕捉し、(iii)プリミティブを逐次的に構成する高レベルプランナと、プリミティブダイナミクスと逆運動学制御を組み合わせた低レベルコントローラを統合することを提案する。
論文 参考訳(メタデータ) (2020-10-11T01:40:03Z) - Automated Search for Resource-Efficient Branched Multi-Task Networks [81.48051635183916]
我々は,多タスクニューラルネットワークにおける分岐構造を自動的に定義する,微分可能なニューラルネットワーク探索に根ざした原理的アプローチを提案する。
本手法は,限られた資源予算内で高い性能の分岐構造を見いだすことができる。
論文 参考訳(メタデータ) (2020-08-24T09:49:19Z) - Self-organization of multi-layer spiking neural networks [4.859525864236446]
発達する脳における複雑な構造の形成を可能にする重要なメカニズムは、神経活動の経時的波の出現である。
多層ニューラルネットワークをシームレスに積み重ねることのできる動的システムの形でモジュール式ツールキットを提案する。
我々のフレームワークは、多層パーセプトロンからオートエンコーダまで、幅広いアーキテクチャの自己組織化に繋がる。
論文 参考訳(メタデータ) (2020-06-12T01:44:48Z) - Decentralized Deep Reinforcement Learning for a Distributed and Adaptive
Locomotion Controller of a Hexapod Robot [0.6193838300896449]
昆虫運動制御において,異なる脚の協調のための分散型組織を提案する。
同時的な局所構造は、歩行行動を改善することができる。
論文 参考訳(メタデータ) (2020-05-21T11:40:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。