論文の概要: A Survey on Reinforcement Learning in Aviation Applications
- arxiv url: http://arxiv.org/abs/2211.02147v1
- Date: Thu, 3 Nov 2022 21:10:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 17:36:47.526025
- Title: A Survey on Reinforcement Learning in Aviation Applications
- Title(参考訳): 航空応用における強化学習に関する調査研究
- Authors: Pouria Razzaghi and Amin Tabrizian and Wei Guo and Shulu Chen and
Abenezer Taye and Ellis Thompson and Alexis Bregeon and Ali Baheri and Peng
Wei
- Abstract要約: 強化学習は、シーケンシャルな意思決定問題を定式化し解決するための、データ駆動の学習ベースのフレームワークを提供する。
RLフレームワークは、航空業界におけるデータ可用性と計算能力の大幅な改善により、有望になった。
- 参考スコア(独自算出の注目度): 5.7528776426748625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Compared with model-based control and optimization methods, reinforcement
learning (RL) provides a data-driven, learning-based framework to formulate and
solve sequential decision-making problems. The RL framework has become
promising due to largely improved data availability and computing power in the
aviation industry. Many aviation-based applications can be formulated or
treated as sequential decision-making problems. Some of them are offline
planning problems, while others need to be solved online and are
safety-critical. In this survey paper, we first describe standard RL
formulations and solutions. Then we survey the landscape of existing RL-based
applications in aviation. Finally, we summarize the paper, identify the
technical gaps, and suggest future directions of RL research in aviation.
- Abstract(参考訳): モデルベース制御と最適化手法と比較して、強化学習(RL)は、シーケンシャルな意思決定問題を定式化し解決するためのデータ駆動型学習ベースのフレームワークを提供する。
RLフレームワークは、航空業界におけるデータ可用性と計算能力の大幅な改善により、有望になった。
多くの航空ベースのアプリケーションは、逐次的な意思決定問題として定式化や処理が可能である。
いくつかはオフライン計画の問題であり、その他はオンラインで解決する必要がある。
本稿では,まず標準 rl 定式化と解法について述べる。
次に,航空における既存のRLベースアプリケーションの状況を調査した。
最後に、本論文を要約し、技術的ギャップを特定し、航空におけるRL研究の今後の方向性を提案する。
関連論文リスト
- D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning [99.33607114541861]
ロボット操作と移動環境の現実的なシミュレーションに焦点を当てたオフラインRLのための新しいベンチマークを提案する。
提案するベンチマークでは、状態ベースドメインと画像ベースドメインを対象とし、オフラインRLとオンライン微調整評価の両方をサポートしている。
論文 参考訳(メタデータ) (2024-08-15T22:27:00Z) - Deep Reinforcement Learning for Real-Time Ground Delay Program Revision and Corresponding Flight Delay Assignments [24.09560293826079]
地上遅延プログラム(英語: Ground Delay Programs, GDP)は、航空交通管理(ATM)において、空港における容量の調整と不一致の要求に使用される一般的な交通管理イニシアチブである。
動作クローン(BC)と保守的Qラーニング(CQL)という2つのRLモデルを開発した。
これらのモデルは、地上および空中遅延と終端領域の混雑を統合した洗練された報酬関数を利用することで、GDP効率を向上させるように設計されている。
論文 参考訳(メタデータ) (2024-05-14T03:48:45Z) - A Survey of Meta-Reinforcement Learning [69.76165430793571]
我々は,メタRLと呼ばれるプロセスにおいて,機械学習問題自体として,より優れたRLアルゴリズムを開発した。
本稿では,タスク分布の存在と各タスクに利用可能な学習予算に基づいて,高レベルでメタRL研究をクラスタ化する方法について議論する。
RL実践者のための標準ツールボックスにメタRLを組み込むことの道程について,オープンな問題を提示することによって,結論を下す。
論文 参考訳(メタデータ) (2023-01-19T12:01:41Z) - A Survey on Offline Reinforcement Learning: Taxonomy, Review, and Open
Problems [0.0]
強化学習(RL)は、急速に人気が高まっている。
高いコストと環境との相互作用の危険性のため、RLにはアクセスできない領域がまだ広い範囲にある。
オフラインRLは、以前に収集されたインタラクションの静的データセットからのみ学習するパラダイムである。
論文 参考訳(メタデータ) (2022-03-02T20:05:11Z) - Pessimistic Model Selection for Offline Deep Reinforcement Learning [56.282483586473816]
深層強化学習(DRL)は多くのアプリケーションにおいてシーケンシャルな意思決定問題を解決する大きな可能性を示している。
主要な障壁の1つは、DRLが学んだ政策の一般化性の低下につながる過度に適合する問題である。
理論的保証のあるオフラインDRLに対する悲観的モデル選択(PMS)手法を提案する。
論文 参考訳(メタデータ) (2021-11-29T06:29:49Z) - Deep Reinforcement Learning and Transportation Research: A Comprehensive
Review [0.0]
DRLの数学的背景、人気があり有望なDRLアルゴリズム、高効率なDRL拡張について概説する。
本稿では, DRL技術の適用性, 強度, 欠点, 一般, 応用に特有な課題について検討する。
論文 参考訳(メタデータ) (2020-10-13T05:23:11Z) - Critic Regularized Regression [70.8487887738354]
批判正規化回帰(CRR)形式を用いてデータからポリシーを学習するための新しいオフラインRLアルゴリズムを提案する。
CRRは驚くほどよく動作し、高次元の状態と行動空間を持つタスクにスケールする。
論文 参考訳(メタデータ) (2020-06-26T17:50:26Z) - RL Unplugged: A Suite of Benchmarks for Offline Reinforcement Learning [108.9599280270704]
オフラインのRL手法を評価・比較するためのRL Unpluggedというベンチマークを提案する。
RL Unpluggedにはゲームやシミュレートされたモーター制御問題を含むさまざまな領域のデータが含まれている。
本論文で提示した全タスクのデータと,全アルゴリズムをオープンソースとして公開する。
論文 参考訳(メタデータ) (2020-06-24T17:14:51Z) - MOPO: Model-based Offline Policy Optimization [183.6449600580806]
オフライン強化学習(英語: offline reinforcement learning, RL)とは、以前に収集された大量のデータから完全に学習ポリシーを学習する問題を指す。
既存のモデルベースRLアルゴリズムは,すでにオフライン設定において大きな利益を上げていることを示す。
本稿では,既存のモデルに基づくRL法を,力学の不確実性によって人為的に罰せられる報酬で適用することを提案する。
論文 参考訳(メタデータ) (2020-05-27T08:46:41Z) - A Survey of Reinforcement Learning Algorithms for Dynamically Varying
Environments [1.713291434132985]
強化学習(Reinforcement Learning, RL)アルゴリズムは、在庫管理、レコメンデータシステム、車両交通管理、クラウドコンピューティング、ロボット工学などの分野で応用されている。
これらの領域で生じる多くのタスクの現実的な合併症は、古典的RLアルゴリズムの基礎となる基本的な仮定で解くのを難しくする。
本稿では、動的に変化する環境モデルを扱うために開発されたRL法について調査する。
これらのアルゴリズムの代表的コレクションは、それらの分類と相対的なメリットとデメリットと共に、この研究で詳細に議論されている。
論文 参考訳(メタデータ) (2020-05-19T09:42:42Z) - Deep Reinforcement Learning for Intelligent Transportation Systems: A
Survey [23.300763504208597]
データ駆動型アプリケーションと輸送システムを組み合わせることは、近年の輸送アプリケーションにおいて重要な役割を担っている。
深部強化学習(RL)に基づく交通制御アプリケーションについて調査する。
論文 参考訳(メタデータ) (2020-05-02T22:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。