論文の概要: A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a
Platform
- arxiv url: http://arxiv.org/abs/2209.02954v1
- Date: Wed, 7 Sep 2022 06:33:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 12:57:08.452133
- Title: A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a
Platform
- Title(参考訳): プラットフォーム上でのuav自律着陸のための深層強化学習戦略
- Authors: Z. Jiang, G. Song
- Abstract要約: 物理シミュレーションプラットフォーム(ROS-RL)の一種であるGazeboに基づく強化学習フレームワークを提案する。
我々は,自律着陸問題に対処するために,3つの連続行動空間強化学習アルゴリズムをフレームワークに使用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of industry, drones are appearing in various field. In
recent years, deep reinforcement learning has made impressive gains in games,
and we are committed to applying deep reinforcement learning algorithms to the
field of robotics, moving reinforcement learning algorithms from game scenarios
to real-world application scenarios. We are inspired by the LunarLander of
OpenAI Gym, we decided to make a bold attempt in the field of reinforcement
learning to control drones. At present, there is still a lack of work applying
reinforcement learning algorithms to robot control, the physical simulation
platform related to robot control is only suitable for the verification of
classical algorithms, and is not suitable for accessing reinforcement learning
algorithms for the training. In this paper, we will face this problem, bridging
the gap between physical simulation platforms and intelligent agent, connecting
intelligent agents to a physical simulation platform, allowing agents to learn
and complete drone flight tasks in a simulator that approximates the real
world. We proposed a reinforcement learning framework based on Gazebo that is a
kind of physical simulation platform (ROS-RL), and used three continuous action
space reinforcement learning algorithms in the framework to dealing with the
problem of autonomous landing of drones. Experiments show the effectiveness of
the algorithm, the task of autonomous landing of drones based on reinforcement
learning achieved full success.
- Abstract(参考訳): 産業の発展に伴い、ドローンは様々な分野に出現している。
近年、深層強化学習はゲームにおいて顕著な進歩を遂げており、ロボット工学分野に深層強化学習アルゴリズムを適用し、強化学習アルゴリズムをゲームシナリオから現実のアプリケーションシナリオに移行することにコミットしています。
OpenAI GymのLunarLanderにインスパイアされた私たちは、ドローンを制御する強化学習の分野で大胆な試みを行うことに決めた。
現在、ロボット制御に強化学習アルゴリズムを適用する作業が不足しており、ロボット制御に関連する物理シミュレーションプラットフォームは古典的アルゴリズムの検証にのみ適しており、訓練に強化学習アルゴリズムにアクセスするには適していない。
本稿では,物理シミュレーションプラットフォームと知的エージェントのギャップを埋め,知的エージェントを物理シミュレーションプラットフォームに接続することで,エージェントが実世界に近いシミュレータでドローンの飛行タスクを学習し,完了できるようにする。
我々は,Gazeboをベースとした,物理シミュレーションプラットフォーム(ROS-RL)の強化学習フレームワークを提案し,ドローンの自律着陸問題に対処するために3つの連続行動空間強化学習アルゴリズムを用いた。
アルゴリズムの有効性を示す実験では、強化学習に基づく自律着陸のタスクが完全な成功を収めた。
関連論文リスト
- An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文 参考訳(メタデータ) (2024-06-17T13:59:52Z) - DexPBT: Scaling up Dexterous Manipulation for Hand-Arm Systems with
Population Based Training [10.808149303943948]
マルチフィンガーハンドエンドエフェクタを備えた模擬片腕または2腕ロボットを用いて,デキスタスな物体操作を学習する。
我々は、深層強化学習の探索能力を大幅に増幅できる分散型人口ベーストレーニング(PBT)アルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-05-20T07:25:27Z) - Learning Deep Sensorimotor Policies for Vision-based Autonomous Drone
Racing [52.50284630866713]
既存のシステムは、状態推定、計画、制御のために手作業によるコンポーネントを必要とすることが多い。
本稿では、深層感触者ポリシーを学習することで、視覚に基づく自律ドローンレース問題に取り組む。
論文 参考訳(メタデータ) (2022-10-26T19:03:17Z) - Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills
using a Quadrupedal Robot [76.04391023228081]
本研究では,四足歩行ロボットが実世界において,強化学習を用いて精度の高い射撃技術を実現できるという課題に対処する。
本研究では, 深層強化学習を活用して頑健な動作制御政策を訓練する階層的枠組みを提案する。
提案するフレームワークをA1四足歩行ロボットに展開し、実世界のランダムなターゲットに向けて正確にボールを発射できるようにする。
論文 参考訳(メタデータ) (2022-08-01T22:34:51Z) - Real-World Dexterous Object Manipulation based Deep Reinforcement
Learning [3.4493195428573613]
ロボットの制御に深層強化学習を用いる方法を示す。
この枠組みは, 深層強化学習の低サンプリング効率の欠点を低減させる。
我々のアルゴリズムはシミュレーションで訓練され、微調整なしで現実に移行した。
論文 参考訳(メタデータ) (2021-11-22T02:48:05Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - Interpretable UAV Collision Avoidance using Deep Reinforcement Learning [1.2693545159861856]
自己注意モデルを用いた深部強化学習を用いた自律型UAV飛行を提案する。
気象や環境によってアルゴリズムをテストした結果,従来のDeep Reinforcement Learningアルゴリズムと比較して頑健であることが判明した。
論文 参考訳(メタデータ) (2021-05-25T23:21:54Z) - Learning to Fly -- a Gym Environment with PyBullet Physics for
Reinforcement Learning of Multi-agent Quadcopter Control [0.0]
本稿では,Bullet物理エンジンに基づく複数クワッドコプターのオープンソース環境を提案する。
マルチエージェントおよびビジョンベースの強化学習インターフェース、および現実的な衝突と空力効果のサポートは、私たちの知識の最高に、その種の最初のものにします。
論文 参考訳(メタデータ) (2021-03-03T02:47:59Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Emergent Real-World Robotic Skills via Unsupervised Off-Policy
Reinforcement Learning [81.12201426668894]
報奨関数を使わずに多様なスキルを習得し,これらのスキルを下流のタスクに再利用する効率的な強化学習手法を開発した。
提案アルゴリズムは学習効率を大幅に向上させ,報酬のない実世界のトレーニングを実現する。
また,学習スキルは,目標指向ナビゲーションのためのモデル予測制御を用いて,追加のトレーニングを伴わずに構成可能であることも実証した。
論文 参考訳(メタデータ) (2020-04-27T17:38:53Z) - AirSim Drone Racing Lab [56.68291351736057]
AirSim Drone Racing Labは、この領域で機械学習研究を可能にするシミュレーションフレームワークである。
本フレームワークは,複数の写真リアル環境下でのレーストラック生成を可能にする。
当社のフレームワークを使用して,NeurIPS 2019で,シミュレーションベースのドローンレースコンペティションを開催しました。
論文 参考訳(メタデータ) (2020-03-12T08:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。