Fugu-MT 論文翻訳(概要): Learning to Control Direct Current Motor for Steering in Real Time via Reinforcement Learning

論文の概要: Learning to Control Direct Current Motor for Steering in Real Time via Reinforcement Learning

arxiv url: http://arxiv.org/abs/2108.00138v1
Date: Sat, 31 Jul 2021 03:24:36 GMT
ステータス: 翻訳完了
システム内更新日: 2021-08-05 04:39:20.799334
Title: Learning to Control Direct Current Motor for Steering in Real Time via Reinforcement Learning
Title（参考訳）: 強化学習によるリアルタイムステアリング用直流モータの学習
Authors: Thomas Watson, Bibek Poudel
Abstract要約: 実機と模擬環境の両方においてゴルフカートの位置制御にNFQアルゴリズムを用いる。シミュレーションでは4分、実際のハードウェアでは11分で制御を成功させました。
参考スコア（独自算出の注目度）: 2.3554584457413483
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Model free techniques have been successful at optimal control of complex systems at an expense of copious amounts of data and computation. However, it is often desired to obtain a control policy in a short period of time with minimal data use and computational burden. To this end, we make use of the NFQ algorithm for steering position control of a golf cart in both a real hardware and a simulated environment that was built from real-world interaction. The controller learns to apply a sequence of voltage signals in the presence of environmental uncertainties and inherent non-linearities that challenge the the control task. We were able to increase the rate of successful control under four minutes in simulation and under 11 minutes in real hardware.
Abstract（参考訳）: モデルフリー技術は、大量のデータと計算を犠牲にして複雑なシステムの最適制御に成功した。しかし,データ使用量や計算負荷を最小限に抑えながら,短時間で制御方針を得ることが望まれることが多い。そこで本研究では,実ハードウェアと実世界のインタラクションから構築したシミュレーション環境の両方において,ゴルフカートの位置制御を行うnfqアルゴリズムを用いた。コントローラは、制御課題に挑戦する環境不確実性や固有の非線形性の存在下で、一連の電圧信号を適用することを学習する。シミュレーションでは4分,実際のハードウェアでは11分でコントロールを成功させることができたのです。

関連論文リスト

TARC: Time-Adaptive Robotic Control [48.61871569444481]
ロボット工学における固定周波数制御は、低周波数制御の効率と高周波制御の堅牢性との間のトレードオフを課す。我々は、ポリシーが制御行動とその適用期間を共同で選択する強化学習アプローチでこの問題に対処する。 2つの異なるハードウェアプラットフォーム上でのゼロショットsim-to-real実験により本手法の有効性を検証した。
論文参考訳（メタデータ） (2025-10-27T10:10:19Z)
Extensive Exploration in Complex Traffic Scenarios using Hierarchical Reinforcement Learning [7.380119332658803]
我々の研究は、複雑な意思決定問題を管理可能なサブタスクに効率的に分解する先駆的な階層的枠組みを導入する。高レベルコントローラと低レベルコントローラを別々にトレーニングする2段階のトレーニングプロセスを採用しています。高レベルコントローラは、長期遅延報酬による探索可能性の向上を示し、低レベルコントローラは、短時間の報酬を使用して、縦方向および横方向の制御機能を提供する。
論文参考訳（メタデータ） (2025-01-25T00:00:11Z)
Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文参考訳（メタデータ） (2024-09-12T11:50:06Z)
Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文参考訳（メタデータ） (2024-02-04T15:54:03Z)
Learning to Fly in Seconds [7.259696592534715]
カリキュラム学習と高度に最適化されたシミュレータが,サンプルの複雑さを増し,学習時間の短縮につながることを示す。我々のフレームワークは、コンシューマ級ラップトップで18秒のトレーニングをした後、直接制御するためのSimulation-to-Real(Sim2Real)転送を可能にする。
論文参考訳（メタデータ） (2023-11-22T01:06:45Z)
Real-Time Model-Free Deep Reinforcement Learning for Force Control of a Series Elastic Actuator [56.11574814802912]
最先端のロボットアプリケーションは、歩行、揚力、操作などの複雑なタスクを達成するために、閉ループ力制御を備えた連続弾性アクチュエータ(SEAs)を使用する。モデルフリーPID制御法はSEAの非線形性により不安定になりやすい。深層強化学習は連続制御タスクに有効なモデルレス手法であることが証明されている。
論文参考訳（メタデータ） (2023-04-11T00:51:47Z)
Improving the Performance of Robust Control through Event-Triggered Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文参考訳（メタデータ） (2022-07-28T17:36:37Z)
Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文参考訳（メタデータ） (2022-07-05T16:33:20Z)
Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文参考訳（メタデータ） (2022-04-14T17:46:26Z)
Using Simulation Optimization to Improve Zero-shot Policy Transfer of Quadrotors [0.14999444543328289]
実世界データを用いて微調整を行うことなく,シミュレーションで完全に強化学習を施した低レベルの制御ポリシを訓練し,四足歩行ロボットに展開することが可能であることを示す。私たちのニューラルネットワークベースのポリシーは、オンボードセンサーデータのみを使用し、組み込みドローンハードウェアで完全に動作します。
論文参考訳（メタデータ） (2022-01-04T22:32:05Z)
Data-Efficient Deep Reinforcement Learning for Attitude Control of Fixed-Wing UAVs: Field Experiments [0.37798600249187286]
DRLは、元の非線形力学を直接操作する固定翼UAVの姿勢制御をうまく学べることを示す。我々は,UAVで学習したコントローラを飛行試験で展開し,最先端のArduPlane比例積分微分(PID)姿勢制御と同等の性能を示す。
論文参考訳（メタデータ） (2021-11-07T19:07:46Z)
Learning a Contact-Adaptive Controller for Robust, Efficient Legged Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文参考訳（メタデータ） (2020-09-21T16:49:26Z)
Vision-Based Autonomous Drone Control using Supervised Learning in Simulation [0.0]
室内環境におけるMAVの自律的ナビゲーションと着陸にSupervised Learningを用いた視覚に基づく制御手法を提案する。我々は、低解像度画像とセンサー入力を高レベル制御コマンドにマッピングする畳み込みニューラルネットワーク(CNN)を訓練した。我々のアプローチは、類似の強化学習アプローチよりも短いトレーニング時間を必要としており、匹敵するSupervised Learningアプローチが直面する手動データ収集の限界を克服する可能性がある。
論文参考訳（メタデータ） (2020-09-09T13:45:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。