論文の概要: Autonomous Control of a Line Follower Robot Using a Q-Learning
Controller
- arxiv url: http://arxiv.org/abs/2001.08841v1
- Date: Thu, 23 Jan 2020 22:50:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 12:46:21.021702
- Title: Autonomous Control of a Line Follower Robot Using a Q-Learning
Controller
- Title(参考訳): Q-Learning Controller を用いたラインフォロワロボットの自律制御
- Authors: Sepehr Saadatmand, Sima Azizi, Mohammadamir Kavousi, and Donald Wunsch
- Abstract要約: 本稿では,ラインフォアロボットを制御するためのシミュレーションベースのQ学習手法を提案する。
ロボットの未知の機械的特性を考えると、システムモデリングとコントローラ設計は極めて困難である。
提案した制御器の有効性を評価するためのシミュレーションと実験結果を提供する。
- 参考スコア(独自算出の注目度): 4.306143768014156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a MIMO simulated annealing SA based Q learning method is
proposed to control a line follower robot. The conventional controller for
these types of robots is the proportional P controller. Considering the unknown
mechanical characteristics of the robot and uncertainties such as friction and
slippery surfaces, system modeling and controller designing can be extremely
challenging. The mathematical modeling for the robot is presented in this
paper, and a simulator is designed based on this model. The basic Q learning
methods are based pure exploitation and the epsilon-greedy methods, which help
exploration, can harm the controller performance after learning completion by
exploring nonoptimal actions. The simulated annealing based Q learning method
tackles this drawback by decreasing the exploration rate when the learning
increases. The simulation and experimental results are provided to evaluate the
effectiveness of the proposed controller.
- Abstract(参考訳): 本稿では,MIMOシミュレーションによるSAベースQ学習法を提案し,ラインフォアロボットを制御した。
この種のロボットの従来のコントローラーは比例pコントローラである。
ロボットの未知の機械的特性と摩擦やすべり面などの不確実性を考えると,システムモデリングやコントローラ設計は極めて困難である。
本論文では,ロボットの数学的モデリングを行い,このモデルに基づいてシミュレータを設計する。
基礎的なQ学習法は純粋に搾取され,エプシロン・グリード法は探索に役立ち,非最適動作を探索することで,学習完了後の制御性能を損なう。
シミュレーションアニーリングに基づくQ学習法は,学習が増加すると探索率を低下させることで,この欠点に対処する。
提案した制御器の有効性を評価するためのシミュレーションと実験結果を提供する。
関連論文リスト
- Simulation-Aided Policy Tuning for Black-Box Robot Learning [47.83474891747279]
本稿では,データ効率の向上に着目した新しいブラックボックスポリシー探索アルゴリズムを提案する。
このアルゴリズムはロボット上で直接学習し、シミュレーションを追加の情報源として扱い、学習プロセスを高速化する。
ロボットマニピュレータ上でのタスク学習の高速化と成功を,不完全なシミュレータの助けを借りて示す。
論文 参考訳(メタデータ) (2024-11-21T15:52:23Z) - Modelling, Positioning, and Deep Reinforcement Learning Path Tracking
Control of Scaled Robotic Vehicles: Design and Experimental Validation [3.807917169053206]
スケールされたロボットカーは通常、車両の状態の推定と制御に特化したタスクを含む階層的な制御機構を備えている。
本稿では, (i) フェデレートされた拡張カルマンフィルタ (FEKF) と (ii) エキスパートデモレータを用いて訓練された新しい深部強化学習 (DRL) パストラッキングコントローラを提案する。
実験により検証されたモデルは、(i)FEKFの設計を支援するために使用され、(ii)DRLに基づく経路追跡アルゴリズムをトレーニングするためのデジタルツインとして機能する。
論文 参考訳(メタデータ) (2024-01-10T14:40:53Z) - Combining model-predictive control and predictive reinforcement learning
for stable quadrupedal robot locomotion [0.0]
モデル予測型と予測型強化型学習コントローラの組み合わせによりこれを実現できるかを検討する。
本研究では,両制御手法を組み合わせて,四足歩行ロボットの安定ゲート生成問題に対処する。
論文 参考訳(メタデータ) (2023-07-15T09:22:37Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Bayesian Optimization Meets Hybrid Zero Dynamics: Safe Parameter
Learning for Bipedal Locomotion Control [17.37169551675587]
両足歩行ロボットの移動制御のためのマルチドメイン制御パラメータ学習フレームワークを提案する。
BOを利用して、HZDベースのコントローラで使用される制御パラメータを学習する。
次に、物理ロボットに学習プロセスを適用し、シミュレーションで学習した制御パラメータの修正を学習する。
論文 参考訳(メタデータ) (2022-03-04T20:48:17Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。