論文の概要: Finite State Machine Policies Modulating Trajectory Generator
- arxiv url: http://arxiv.org/abs/2109.12696v1
- Date: Sun, 26 Sep 2021 20:27:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 15:10:18.771738
- Title: Finite State Machine Policies Modulating Trajectory Generator
- Title(参考訳): 軌道生成器を変調する有限状態機械ポリシー
- Authors: Ren Liu, Nitish Sontakke, Sehoon Ha
- Abstract要約: 研究者は、トラックジェネレータ(TG)とフィードバック制御信号を組み合わせてより堅牢な動作を実現する新しいアーキテクチャ、PMTG(Policies Modulating Trajectory Generators)を調査した。
本研究では、単純なTGを非同期有限状態マシン(Async FSM)に置き換えることで、PMTGフレームワークを有限状態マシンPMTGで拡張することを提案する。
提案したアーキテクチャは、シミュレーションと実際のロボットの両方において、挑戦的な地形や外乱といった様々なシナリオでより堅牢な動作を実現することができることを示した。
- 参考スコア(独自算出の注目度): 5.939164722752263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning (deep RL) has emerged as an effective tool for
developing controllers for legged robots. However, a simple neural network
representation is known for its poor extrapolation ability, making the learned
behavior vulnerable to unseen perturbations or challenging terrains. Therefore,
researchers have investigated a novel architecture, Policies Modulating
Trajectory Generators (PMTG), which combines trajectory generators (TG) and
feedback control signals to achieve more robust behaviors. In this work, we
propose to extend the PMTG framework with a finite state machine PMTG by
replacing simple TGs with asynchronous finite state machines (Async FSMs). This
invention offers an explicit notion of contact events to the policy to
negotiate unexpected perturbations. We demonstrated that the proposed
architecture could achieve more robust behaviors in various scenarios, such as
challenging terrains or external perturbations, on both simulated and real
robots. The supplemental video can be found at: http://youtu.be/XUiTSZaM8f0.
- Abstract(参考訳): 深層強化学習(deep rl)は脚付きロボットのためのコントローラを開発するための効果的なツールとして登場した。
しかし、単純なニューラルネットワーク表現は、外挿能力の貧弱さで知られており、学習された振る舞いは目に見えない摂動や困難な地形に弱い。
そこで研究者らは、より堅牢な動作を実現するために、軌道発生器(TG)とフィードバック制御信号を組み合わせた新しいアーキテクチャ、PMTG(Policies Modulating Trajectory Generators)を調査した。
本研究では、単純なTGを非同期有限状態マシン(Async FSM)に置き換えることで、PMTGフレームワークを有限状態マシンPMTGで拡張することを提案する。
本発明は、予期せぬ摂動を交渉する政策に対して、接触イベントの明確な概念を提供する。
提案手法は,シミュレーションロボットと実ロボットの両方において,挑戦的地形や外的摂動といった様々なシナリオにおいて,より堅牢な動作を実現することを実証した。
補足ビデオはhttp://youtu.be/xuitszam8f0.com/で見ることができる。
関連論文リスト
- RobotDiffuse: Motion Planning for Redundant Manipulator based on Diffusion Model [13.110235244912474]
冗長マニピュレータは、キネマティック性能と汎用性の向上を提供する。
これらのマニピュレータの動作計画は、DOFの増加と複雑な動的環境のために困難である。
本稿では,冗長マニピュレータにおける運動計画のための拡散モデルに基づくロボットディフューズを提案する。
論文 参考訳(メタデータ) (2024-12-27T07:34:54Z) - Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot [19.789369416528604]
グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。
以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。
シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
論文 参考訳(メタデータ) (2023-11-13T11:29:06Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Constrained Dynamic Movement Primitives for Safe Learning of Motor
Skills [25.06692536893836]
ロボット作業空間における制約満足度を実現するための制約付き動的運動プリミティブ(CDMP)を提案する。
異なる環境における異なるマニピュレータを用いた提案アルゴリズムの実装を示すビデオがここにある。
論文 参考訳(メタデータ) (2022-09-28T22:59:33Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Learning Robust Policy against Disturbance in Transition Dynamics via
State-Conservative Policy Optimization [63.75188254377202]
深層強化学習アルゴリズムは、ソースとターゲット環境の相違により、現実世界のタスクでは不十分な処理を行うことができる。
本研究では,前もって乱れをモデル化せずにロバストなポリシーを学習するための,モデルフリーなアクター批判アルゴリズムを提案する。
いくつかのロボット制御タスクの実験では、SCPOは遷移力学の乱れに対する堅牢なポリシーを学習している。
論文 参考訳(メタデータ) (2021-12-20T13:13:05Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Transformers Solve the Limited Receptive Field for Monocular Depth
Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。
連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文 参考訳(メタデータ) (2021-03-22T18:00:13Z) - COCOI: Contact-aware Online Context Inference for Generalizable
Non-planar Pushing [87.7257446869134]
一般的なコンタクトリッチな操作問題は、ロボット工学における長年の課題である。
深層強化学習は、ロボット操作タスクの解決に大きな可能性を示している。
動的プロパティのコンテキスト埋め込みをオンラインにエンコードする深層RL法であるCOCOIを提案する。
論文 参考訳(メタデータ) (2020-11-23T08:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。