論文の概要: Experimental Study on Reinforcement Learning-based Control of an Acrobot
- arxiv url: http://arxiv.org/abs/2011.09246v2
- Date: Thu, 27 Jul 2023 10:09:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-28 21:08:14.402733
- Title: Experimental Study on Reinforcement Learning-based Control of an Acrobot
- Title(参考訳): アクロボットの強化学習に基づく制御に関する実験的研究
- Authors: Leo Dostal, Alexej Bespalko, and Daniel A. Duecker
- Abstract要約: 我々は、強化学習(RL)を用いて人工知能がアクロボットを制御する方法の学習結果を示す。
本研究では,アクロボットの角速度の制御と,その運動エネルギーとポテンシャルエネルギーの和である総エネルギーの制御について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present computational and experimental results on how artificial
intelligence (AI) learns to control an Acrobot using reinforcement learning
(RL). Thereby the experimental setup is designed as an embedded system, which
is of interest for robotics and energy harvesting applications. Specifically,
we study the control of angular velocity of the Acrobot, as well as control of
its total energy, which is the sum of the kinetic and the potential energy. By
this means the RL algorithm is designed to drive the angular velocity or the
energy of the first pendulum of the Acrobot towards a desired value. With this,
libration or full rotation of the unactuated pendulum of the Acrobot is
achieved. Moreover, investigations of the Acrobot control are carried out,
which lead to insights about the influence of the state space discretization,
the episode length, the action space or the mass of the driven pendulum on the
RL control. By further numerous simulations and experiments the effects of
parameter variations are evaluated.
- Abstract(参考訳): 本稿では,人工知能(ai)が強化学習(rl)を用いて交流ロボットを制御する方法に関する計算および実験結果を示す。
このように、実験的なセットアップは、ロボット工学およびエネルギー収穫アプリケーションに興味のある組み込みシステムとして設計される。
具体的には、交流ロボットの角速度の制御と、運動量とポテンシャルエネルギーの合計である全エネルギーの制御について研究する。
すなわち、RLアルゴリズムは、アクロボットの第1振り子の角速度またはエネルギーを所望の値に駆動するように設計されている。
これにより、acrobotのunctuated pendulumのリブレーションまたは完全な回転が達成される。
さらに、アクロボット制御の研究を行い、状態空間の離散化、エピソード長、動作空間、または駆動振子の質量がRL制御に与える影響について考察する。
さらに多くのシミュレーションと実験により、パラメータ変動の影響が評価される。
関連論文リスト
- Online Behavior Modification for Expressive User Control of RL-Trained Robots [1.6078134198754157]
オンライン行動修正は、RL学習ポリシーを用いてタスクを自律的に完了すると、ユーザがロボットの行動特性をリアルタイムで制御するパラダイムである。
本稿では,行動多様性に基づくアルゴリズム,ACORD(Adjustable Control of RL Dynamics)を提案する。
論文 参考訳(メタデータ) (2024-08-15T12:28:08Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - On the Role of the Action Space in Robot Manipulation Learning and Sim-to-Real Transfer [6.1622717998840395]
本研究では,ロボット操作学習とシミュレート・トゥ・リアル・トランスファーにおける行動空間の選択について検討する。
我々は250以上の強化学習(RL)エージェントを訓練し、タスクの到達とプッシュをシミュレートした。
空間の選択は、共通のアクション空間設計特性の組み合わせにまたがる。
論文 参考訳(メタデータ) (2023-12-06T18:38:05Z) - A Q-learning approach to the continuous control problem of robot
inverted pendulum balancing [0.29008108937701327]
本研究では,ロボット逆振り子バランスの連続制御問題に対する離散的行動空間強化学習法(Q-learning)の適用性を評価する。
システム力学の数学的モデルが実装され、実システムから取得したデータに対する曲線フィッティングによって導出される。
論文 参考訳(メタデータ) (2023-12-05T10:40:48Z) - Reaching the Limit in Autonomous Racing: Optimal Control versus
Reinforcement Learning [66.10854214036605]
ロボット工学における中心的な問題は、アジャイルなモバイルロボットの制御システムをどうやって設計するかである。
本稿では、強化学習(RL)で訓練されたニューラルネットワークコントローラが最適制御(OC)法より優れていることを示す。
その結果、アジャイルドローンを最大性能に押し上げることができ、最大加速速度は重力加速度の12倍以上、ピーク速度は時速108kmに達しました。
論文 参考訳(メタデータ) (2023-10-17T02:40:27Z) - Active Exploration for Robotic Manipulation [40.39182660794481]
本稿では,スパース・リワード型ロボット操作作業における効率的な学習を可能にするモデルに基づく能動探索手法を提案する。
我々は,提案アルゴリズムをシミュレーションおよび実ロボットで評価し,スクラッチから本手法を訓練した。
論文 参考訳(メタデータ) (2022-10-23T18:07:51Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Autonomous Aerial Robot for High-Speed Search and Intercept Applications [86.72321289033562]
高速物体把握のための完全自律飛行ロボットが提案されている。
追加のサブタスクとして、我々のシステムは、表面に近い極にある気球を自律的にピアスすることができる。
我々のアプローチは、挑戦的な国際競争で検証され、優れた結果が得られました。
論文 参考訳(メタデータ) (2021-12-10T11:49:51Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z) - Populations of Spiking Neurons for Reservoir Computing: Closed Loop
Control of a Compliant Quadruped [64.64924554743982]
本稿では,ニューラルネットワークを用いた中央パターン生成機構を実装し,閉ループロボット制御を実現するためのフレームワークを提案する。
本研究では,従順な四足歩行ロボットのシミュレーションモデル上で,予め定義された歩行パターン,速度制御,歩行遷移の学習を実演する。
論文 参考訳(メタデータ) (2020-04-09T14:32:49Z) - Autonomous Control of a Line Follower Robot Using a Q-Learning
Controller [4.306143768014156]
本稿では,ラインフォアロボットを制御するためのシミュレーションベースのQ学習手法を提案する。
ロボットの未知の機械的特性を考えると、システムモデリングとコントローラ設計は極めて困難である。
提案した制御器の有効性を評価するためのシミュレーションと実験結果を提供する。
論文 参考訳(メタデータ) (2020-01-23T22:50:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。