論文の概要: Reinforcement Learning-Based Air Traffic Deconfliction
- arxiv url: http://arxiv.org/abs/2301.01861v1
- Date: Thu, 5 Jan 2023 00:37:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 14:36:35.364605
- Title: Reinforcement Learning-Based Air Traffic Deconfliction
- Title(参考訳): 強化学習に基づく空気交通の分離
- Authors: Denis Osipychev, Dragos Margineantu, Girish Chowdhary
- Abstract要約: 本研究は,2機の水平分離を自動化することに焦点を当て,障害物回避問題を2次元サロゲート最適化課題として提示する。
強化学習(RL)を用いて、回避ポリシーを最適化し、ダイナミクス、インタラクション、意思決定をモデル化する。
提案システムは,安全要件を満たす高速かつ達成可能な回避軌道を生成する。
- 参考スコア(独自算出の注目度): 7.782300855058585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remain Well Clear, keeping the aircraft away from hazards by the appropriate
separation distance, is an essential technology for the safe operation of
uncrewed aerial vehicles in congested airspace. This work focuses on automating
the horizontal separation of two aircraft and presents the obstacle avoidance
problem as a 2D surrogate optimization task. By our design, the surrogate task
is made more conservative to guarantee the execution of the solution in the
primary domain. Using Reinforcement Learning (RL), we optimize the avoidance
policy and model the dynamics, interactions, and decision-making. By
recursively sampling the resulting policy and the surrogate transitions, the
system translates the avoidance policy into a complete avoidance trajectory.
Then, the solver publishes the trajectory as a set of waypoints for the
airplane to follow using the Robot Operating System (ROS) interface. The
proposed system generates a quick and achievable avoidance trajectory that
satisfies the safety requirements. Evaluation of our system is completed in a
high-fidelity simulation and full-scale airplane demonstration. Moreover, the
paper concludes an enormous integration effort that has enabled a real-life
demonstration of the RL-based system.
- Abstract(参考訳): 適切な離間距離で航空機を危険から遠ざけるための残留ウェルクリアは、密集した空域で無人航空機を安全に運用するための重要な技術である。
本研究は,2機の航空機の水平分離の自動化に着目し,障害物回避問題を2次元サロゲート最適化タスクとして提示する。
私たちの設計では、サブロゲートタスクはプライマリドメインにおけるソリューションの実行を保証するためにより保守的になります。
強化学習(rl)を用いることで,回避方針を最適化し,ダイナミクス,インタラクション,意思決定をモデル化する。
結果のポリシーとサロゲート遷移を再帰的にサンプリングすることで、システムは回避ポリシーを完全な回避軌道に変換する。
そして、この軌道を、ロボットオペレーティングシステム(ros)インタフェースを用いて飛行機が追従するための経路のセットとして公開する。
提案システムは,安全要件を満たす高速かつ達成可能な回避軌道を生成する。
本システムの評価は高忠実度シミュレーションおよび実機実機実験で完了した。
さらに,本論文では,RLシステムの実演を実現するための膨大な統合作業について述べる。
関連論文リスト
- Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Spacecraft Autonomous Decision-Planning for Collision Avoidance: a
Reinforcement Learning Approach [0.0]
本研究は、強化学習技術に基づく宇宙船における自律的なCA意思決定機能の実装を提案する。
提案フレームワークは,軌道上の破片の状態を不完全な監視し,正確な衝突回避策(CAM)を実行するためのポリシーをAIシステムが効果的に学習できるようにする。
目的は、CAMを自律的に実施するための意思決定プロセスを、人間の介入なしに宇宙船に委譲することである。
論文 参考訳(メタデータ) (2023-10-29T10:15:33Z) - Toward collision-free trajectory for autonomous and pilot-controlled
unmanned aerial vehicles [1.018017727755629]
本研究は、高度衝突管理手法の開発において、PilotAware Ltdが入手した電子情報(EC)をより活用するものである。
DACM手法の利点は、空中衝突を避けるための広範囲なシミュレーションと実世界のフィールドテストによって実証されてきた。
論文 参考訳(メタデータ) (2023-09-18T18:24:31Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Reward Function Optimization of a Deep Reinforcement Learning Collision
Avoidance System [0.0]
無人航空機システム(UAS)の普及により、航空宇宙規制当局はこれらの航空機と衝突回避システムとの相互運用性を検討するようになった。
現在義務化されているTCASの制限により、連邦航空局は新たなソリューションである空中衝突回避システムX(ACAS X)の開発を委託した。
本研究では,サロゲートを用いてパラメータを調整したDRL衝突回避システムの利点について検討する。
論文 参考訳(メタデータ) (2022-12-01T20:20:41Z) - Smooth Trajectory Collision Avoidance through Deep Reinforcement
Learning [0.0]
本稿では,DRLに基づくナビゲーションソリューションにおける2つの重要な問題に対処するために,エージェントの状態と報酬関数の設計を提案する。
我々のモデルは、衝突の可能性を著しく低減しつつ、UAVのスムーズな飛行を確保するために、マージンの報酬と滑らかさの制約に依存している。
論文 参考訳(メタデータ) (2022-10-12T16:27:32Z) - Obstacle Avoidance for UAS in Continuous Action Space Using Deep
Reinforcement Learning [9.891207216312937]
小型無人航空機の障害物回避は将来の都市空輸の安全に不可欠である。
本稿では, PPO(Proximal Policy Optimization)に基づく深層強化学習アルゴリズムを提案する。
その結果,提案モデルが正確かつ堅牢なガイダンスを提供し,99%以上の成功率で競合を解消できることが示唆された。
論文 参考訳(メタデータ) (2021-11-13T04:44:53Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Model-Based Meta-Reinforcement Learning for Flight with Suspended
Payloads [69.21503033239985]
吊り下げられたペイロードの輸送は、自律的な航空車両にとって困難である。
接続後飛行データから数秒以内に変化力学のモデルを学習するメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2020-04-23T17:43:56Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。