論文の概要: Harfang3D Dog-Fight Sandbox: A Reinforcement Learning Research Platform
for the Customized Control Tasks of Fighter Aircrafts
- arxiv url: http://arxiv.org/abs/2210.07282v1
- Date: Thu, 13 Oct 2022 18:18:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 17:29:03.480436
- Title: Harfang3D Dog-Fight Sandbox: A Reinforcement Learning Research Platform
for the Customized Control Tasks of Fighter Aircrafts
- Title(参考訳): Harfang3D Dog-Fight Sandbox: 戦闘機のカスタマイズ制御タスクのための強化学習研究プラットフォーム
- Authors: Muhammed Murat \"Ozbek and S\"uleyman Y{\i}ld{\i}r{\i}m and Muhammet
Aksoy and Eric Kernin and Emre Koyuncu
- Abstract要約: 本研究では,戦闘機用の半現実的な飛行シミュレーション環境であるHarfang3D Dog-Fight Sandboxを提案する。
強化学習を用いた航空研究における主な課題を調査するための柔軟なツールボックスである。
ソフトウェアはまた、ボット航空機の配備とマルチエージェントタスクの開発を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The advent of deep learning (DL) gave rise to significant breakthroughs in
Reinforcement Learning (RL) research. Deep Reinforcement Learning (DRL)
algorithms have reached super-human level skills when applied to vision-based
control problems as such in Atari 2600 games where environment states were
extracted from pixel information. Unfortunately, these environments are far
from being applicable to highly dynamic and complex real-world tasks as in
autonomous control of a fighter aircraft since these environments only involve
2D representation of a visual world. Here, we present a semi-realistic flight
simulation environment Harfang3D Dog-Fight Sandbox for fighter aircrafts. It is
aimed to be a flexible toolbox for the investigation of main challenges in
aviation studies using Reinforcement Learning. The program provides easy access
to flight dynamics model, environment states, and aerodynamics of the plane
enabling user to customize any specific task in order to build intelligent
decision making (control) systems via RL. The software also allows deployment
of bot aircrafts and development of multi-agent tasks. This way, multiple
groups of aircrafts can be configured to be competitive or cooperative agents
to perform complicated tasks including Dog Fight. During the experiments, we
carried out training for two different scenarios: navigating to a designated
location and within visual range (WVR) combat, shortly Dog Fight. Using Deep
Reinforcement Learning techniques for both scenarios, we were able to train
competent agents that exhibit human-like behaviours. Based on this results, it
is confirmed that Harfang3D Dog-Fight Sandbox can be utilized as a 3D realistic
RL research platform.
- Abstract(参考訳): 深層学習(DL)の出現は、強化学習(RL)研究に大きなブレークスルーをもたらした。
深層強化学習(DRL)アルゴリズムは, 画素情報から環境状態が抽出されたAtari 2600ゲームなどにおいて, 視覚ベースの制御問題に適用された場合, 超人間レベルに到達した。
残念なことに、これらの環境は戦闘機の自律的な制御のように、非常にダイナミックで複雑な現実世界のタスクには適用できない。
本稿では,戦闘機用の半現実的な飛行シミュレーション環境であるHarfang3D Dog-Fight Sandboxを紹介する。
強化学習を用いた航空研究における主な課題を調査するための柔軟なツールボックスである。
このプログラムは、飛行力学モデル、環境状態、航空機の空気力学に容易にアクセスでき、ユーザーはRLを介してインテリジェントな意思決定(制御)システムを構築するために特定のタスクをカスタマイズできる。
このソフトウェアは、ボット航空機の配備やマルチエージェントタスクの開発を可能にする。
このように、複数の航空機群は、犬の戦いを含む複雑なタスクを実行するための競争的または協力的なエージェントとして構成することができる。
実験では、指定された場所へのナビゲートと、間もなくドッグファイトとなる視覚範囲(WVR)戦闘の2つの異なるシナリオのトレーニングを行った。
両シナリオの深層強化学習技術を用いて,人間のような行動を示す有能なエージェントを訓練することができた。
この結果から,Harfang3D Dog-Fight SandboxをリアルなRL研究プラットフォームとして活用できることが確認された。
関連論文リスト
- Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - An Imitative Reinforcement Learning Framework for Autonomous Dogfight [20.150691753213817]
無人戦闘空母(UCAV)は、空戦において決定的な役割を担っている。
本稿では,自律的な探索を可能にしつつ,専門家データを効率的に活用する,新しい擬似強化学習フレームワークを提案する。
提案した枠組みは,UCAVの「プール・ロック・ローンチ」におけるドッグファイト・ポリシーを成功に導くことができる。
論文 参考訳(メタデータ) (2024-06-17T13:59:52Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - WILD-SCAV: Benchmarking FPS Gaming AI on Unity3D-based Environments [5.020816812380825]
深部強化学習(RL)の最近の進歩は,シミュレーション環境における複雑な意思決定能力を示している。
しかしながら、これらは、トレーニングやテストが行われる環境の複雑さやバリエーションが欠如しているため、より複雑な問題はほとんどありません。
我々は,このギャップを埋めるために,3次元オープンワールドFPSゲームに基づく,強力でオープンな環境であるWILD-SCAVを開発した。
エージェントは3D環境を理解し、ナビゲートし、計画し、人間のような方法で競争し、協力することができる。
論文 参考訳(メタデータ) (2022-10-14T13:39:41Z) - Parallel Reinforcement Learning Simulation for Visual Quadrotor
Navigation [4.597465975849579]
強化学習(Reinforcement Learning、RL)は、ロボットに物理的な世界の中をナビゲートするように教えるエージェントベースのアプローチである。
本稿では,AirSim上に構築された並列学習を効率的に行うシミュレーションフレームワークを提案する。
このフレームワーク上に構築されたApe-Xは、AirSim環境の分散トレーニングを組み込むように修正されている。
論文 参考訳(メタデータ) (2022-09-22T15:27:42Z) - Unsupervised Learning of Efficient Geometry-Aware Neural Articulated
Representations [89.1388369229542]
本稿では,3次元幾何認識による音声オブジェクトの表現学習のための教師なし手法を提案する。
私たちは、GANトレーニングで表現を学ぶことで、このニーズを回避します。
実験は,本手法の有効性を実証し,GANに基づくトレーニングにより,制御可能な3次元表現を,監督なしで学習できることを示す。
論文 参考訳(メタデータ) (2022-04-19T12:10:18Z) - Learning to Fly -- a Gym Environment with PyBullet Physics for
Reinforcement Learning of Multi-agent Quadcopter Control [0.0]
本稿では,Bullet物理エンジンに基づく複数クワッドコプターのオープンソース環境を提案する。
マルチエージェントおよびビジョンベースの強化学習インターフェース、および現実的な衝突と空力効果のサポートは、私たちの知識の最高に、その種の最初のものにします。
論文 参考訳(メタデータ) (2021-03-03T02:47:59Z) - Robust Reinforcement Learning-based Autonomous Driving Agent for
Simulation and Real World [0.0]
本稿では,Deep Q-Networks (DQN) を用いた自律型ロボット制御を実現するDRLベースのアルゴリズムを提案する。
本手法では,エージェントはシミュレーション環境で訓練され,シミュレーション環境と実環境環境の両方をナビゲートすることができる。
トレーニングされたエージェントは限られたハードウェアリソース上で動作することができ、そのパフォーマンスは最先端のアプローチに匹敵する。
論文 参考訳(メタデータ) (2020-09-23T15:23:54Z) - Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks [70.56451186797436]
本研究では,メタ強化学習を用いてシミュレーションの課題の大部分を解決する方法について検討する。
エージェントを訓練して現実の挿入タスクを成功させる手法を実証する。
論文 参考訳(メタデータ) (2020-04-29T18:00:22Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。