論文の概要: Learning to Fly via Deep Model-Based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2003.08876v3
- Date: Tue, 4 Aug 2020 10:41:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 03:30:41.710142
- Title: Learning to Fly via Deep Model-Based Reinforcement Learning
- Title(参考訳): 深層モデルに基づく強化学習による飛行学習
- Authors: Philip Becker-Ehmck, Maximilian Karl, Jan Peters, Patrick van der
Smagt
- Abstract要約: モデルベース強化学習により, 四角子に対する推力制御系を学習する。
を1台のドローンで30分未満の経験で達成できることが示されています。
- 参考スコア(独自算出の注目度): 37.37420200406336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning to control robots without requiring engineered models has been a
long-term goal, promising diverse and novel applications. Yet, reinforcement
learning has only achieved limited impact on real-time robot control due to its
high demand of real-world interactions. In this work, by leveraging a learnt
probabilistic model of drone dynamics, we learn a thrust-attitude controller
for a quadrotor through model-based reinforcement learning. No prior knowledge
of the flight dynamics is assumed; instead, a sequential latent variable model,
used generatively and as an online filter, is learnt from raw sensory input.
The controller and value function are optimised entirely by propagating
stochastic analytic gradients through generated latent trajectories. We show
that "learning to fly" can be achieved with less than 30 minutes of experience
with a single drone, and can be deployed solely using onboard computational
resources and sensors, on a self-built drone.
- Abstract(参考訳): エンジニアリングされたモデルを必要とせずにロボットを制御できることは長期的な目標であり、多様な新しい応用を約束してきた。
しかし、強化学習は、実世界の相互作用の需要が高いため、リアルタイムロボット制御に限られた影響しか与えていない。
本研究では、ドローン力学の学習確率モデルを活用することにより、モデルに基づく強化学習を通じて、四角子に対する推力制御を学習する。
フライトダイナミクスに関する事前知識は想定されず、代わりに、オンラインフィルタとして生成的に使用される逐次潜在変数モデルが生の知覚入力から学習される。
制御器と値関数は、生成された潜在軌道を通して確率的解析勾配を伝播することによって完全に最適化される。
飛べる学習」は1機のドローンで30分未満の経験で達成でき、内蔵の計算リソースとセンサーだけで自己構築型ドローンに展開できることを示した。
関連論文リスト
- Learning to enhance multi-legged robot on rugged landscapes [7.956679144631909]
多足ロボットは、頑丈な風景をナビゲートするための有望なソリューションを提供する。
近年の研究では、線形制御器が挑戦的な地形上で信頼性の高い移動性を確保することが示されている。
我々は,このロボットプラットフォームに適した MuJoCo ベースのシミュレータを開発し,シミュレーションを用いて強化学習に基づく制御フレームワークを開発する。
論文 参考訳(メタデータ) (2024-09-14T15:53:08Z) - BiRoDiff: Diffusion policies for bipedal robot locomotion on unseen terrains [0.9480364746270075]
未知の地形での移動は、二足歩行ロボットが新しい現実世界の課題に対処するために不可欠である。
複数の地形を移動させる単一の歩行制御系を学習する軽量なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T16:03:33Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - End-to-End Reinforcement Learning for Torque Based Variable Height
Hopping [5.34772724436823]
足の移動は自然または非構造地形を扱うのに最も適しており、多用途であることは間違いない。
本稿では,ジャンプ位相を暗黙的に検出するエンド・ツー・エンドのRL型トルクコントローラを提案する。
また、学習した制御器がリッチな動的タスクに接触できるように、シミュレーション手法を拡張し、ロボットへの展開を成功させる。
論文 参考訳(メタデータ) (2023-07-31T13:51:29Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Learning to Fly -- a Gym Environment with PyBullet Physics for
Reinforcement Learning of Multi-agent Quadcopter Control [0.0]
本稿では,Bullet物理エンジンに基づく複数クワッドコプターのオープンソース環境を提案する。
マルチエージェントおよびビジョンベースの強化学習インターフェース、および現実的な衝突と空力効果のサポートは、私たちの知識の最高に、その種の最初のものにします。
論文 参考訳(メタデータ) (2021-03-03T02:47:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。