論文の概要: Learning-'N-Flying: A Learning-based, Decentralized Mission Aware UAS
Collision Avoidance Scheme
- arxiv url: http://arxiv.org/abs/2101.10404v1
- Date: Mon, 25 Jan 2021 20:38:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 22:19:23.345698
- Title: Learning-'N-Flying: A Learning-based, Decentralized Mission Aware UAS
Collision Avoidance Scheme
- Title(参考訳): Learning-'N-Flying: 学習ベースの分散型ミッションAware UAS衝突回避スキーム
- Authors: Al\"ena Rodionova (1), Yash Vardhan Pant (2), Connor Kurtz (3), Kuk
Jang (1), Houssam Abbas (3), Rahul Mangharam (1) ((1) University of
Pennsylvania, (2) University of California Berkeley, (3) Oregon State
University)
- Abstract要約: Learning-'N-Flying (LNF) はマルチUAS衝突回避(CA)フレームワークである。
分散化され、オンザフライで動作し、異なるオペレータが管理する自律uasが複雑なミッションを安全に実行できるようにする。
提案手法はオンライン(数ミリ秒単位の計算時間)で動作可能であり,特定の仮定下では,最悪の場合,1%未満の障害率であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Urban Air Mobility, the scenario where hundreds of manned and Unmanned
Aircraft System (UAS) carry out a wide variety of missions (e.g. moving humans
and goods within the city), is gaining acceptance as a transportation solution
of the future. One of the key requirements for this to happen is safely
managing the air traffic in these urban airspaces. Due to the expected density
of the airspace, this requires fast autonomous solutions that can be deployed
online. We propose Learning-'N-Flying (LNF) a multi-UAS Collision Avoidance
(CA) framework. It is decentralized, works on-the-fly and allows autonomous UAS
managed by different operators to safely carry out complex missions,
represented using Signal Temporal Logic, in a shared airspace. We initially
formulate the problem of predictive collision avoidance for two UAS as a
mixed-integer linear program, and show that it is intractable to solve online.
Instead, we first develop Learning-to-Fly (L2F) by combining: a) learning-based
decision-making, and b) decentralized convex optimization-based control. LNF
extends L2F to cases where there are more than two UAS on a collision path.
Through extensive simulations, we show that our method can run online
(computation time in the order of milliseconds), and under certain assumptions
has failure rates of less than 1% in the worst-case, improving to near 0% in
more relaxed operations. We show the applicability of our scheme to a wide
variety of settings through multiple case studies.
- Abstract(参考訳): アーバン・エア・モビリティ(Urban Air Mobility)は、数百人の有人無人航空機システム(UAS)が様々なミッションを行うシナリオである。
都市内の人間や商品を移動させること)は、未来の輸送ソリューションとして受け入れられている。
これが起こるための重要な要件の1つは、これらの都市圏の航空交通を安全に管理することです。
空域の密度が予想されるため、オンラインで展開できる高速な自律的なソリューションが必要です。
マルチUAS衝突回避(CA)フレームワークLearning-'N-Flying (LNF)を提案する。
分散化され、オン・ザ・フライで動作し、異なるオペレータが管理する自律uasが、信号時相論理を用いて、共通の空域で複雑なミッションを安全に行うことができる。
まず,混合整数線形プログラムとして2つのUASの予測衝突回避問題を定式化し,オンラインでの解決が困難であることを示す。
a)学習に基づく意思決定,b)分散凸最適化に基づく制御を組み合わせることで,まずL2F(Learning-to-Fly)を開発する。
LNFは衝突経路に2つ以上のUASがある場合にL2Fを拡張します。
広範なシミュレーションにより,本手法がオンライン(ミリ秒単位の計算時間)で実行可能であること,最悪の場合には障害率が1%未満であること,よりリラックスした操作では0%近く改善できることを示した。
複数のケーススタディを通して,提案手法を多種多様な設定に適用可能であることを示す。
関連論文リスト
- Multi-UAV Pursuit-Evasion with Online Planning in Unknown Environments by Deep Reinforcement Learning [16.761470423715338]
マルチUAV追跡回避は、UAV群知能にとって重要な課題である。
本研究では,協調戦略学習における部分的可観測性に対処するために,回避者予測強化ネットワークを導入する。
我々は、2段階の報酬改善を通じて実現可能な政策を導出し、ゼロショット方式で実四重項にポリシーを展開する。
論文 参考訳(メタデータ) (2024-09-24T08:40:04Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Reinforcement Learning-Based Air Traffic Deconfliction [7.782300855058585]
本研究は,2機の水平分離を自動化することに焦点を当て,障害物回避問題を2次元サロゲート最適化課題として提示する。
強化学習(RL)を用いて、回避ポリシーを最適化し、ダイナミクス、インタラクション、意思決定をモデル化する。
提案システムは,安全要件を満たす高速かつ達成可能な回避軌道を生成する。
論文 参考訳(メタデータ) (2023-01-05T00:37:20Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Obstacle Avoidance for UAS in Continuous Action Space Using Deep
Reinforcement Learning [9.891207216312937]
小型無人航空機の障害物回避は将来の都市空輸の安全に不可欠である。
本稿では, PPO(Proximal Policy Optimization)に基づく深層強化学習アルゴリズムを提案する。
その結果,提案モデルが正確かつ堅牢なガイダンスを提供し,99%以上の成功率で競合を解消できることが示唆された。
論文 参考訳(メタデータ) (2021-11-13T04:44:53Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Learning-to-Fly: Learning-based Collision Avoidance for Scalable Urban
Air Mobility [2.117421588033177]
複数のUASのための分散型オンデマンド空中衝突回避フレームワークであるL2F(Learning-to-Fly)を提案する。
L2Fは,1)学習に基づく意思決定方式と,2)分散線形プログラミングに基づくUAS制御アルゴリズムからなる2段階衝突回避手法である。
本手法のリアルタイム適用性は,MILP法よりも6000ドル高速であり,操作の余地が十分ある場合,100%の衝突を解消できる。
論文 参考訳(メタデータ) (2020-06-23T18:46:31Z) - Congestion-aware Evacuation Routing using Augmented Reality Devices [96.68280427555808]
複数の目的地間でリアルタイムに個別の避難経路を生成する屋内避難のための渋滞対応ルーティングソリューションを提案する。
建物内の混雑分布をモデル化するために、ユーザエンド拡張現実(AR)デバイスから避難者の位置を集約して、オンザフライで取得した人口密度マップを用いる。
論文 参考訳(メタデータ) (2020-04-25T22:54:35Z) - Using Deep Reinforcement Learning Methods for Autonomous Vessels in 2D
Environments [11.657524999491029]
本研究では,Q-Learningとニューラル表現を組み合わせた深層強化学習を用いて不安定性を回避する。
当社の方法論では,Q-Learningを深く使用して,アジャイル方法論のローリングウェーブプランニングアプローチと組み合わせています。
実験の結果,VVNの長距離ミッションの平均性能は55.31倍に向上した。
論文 参考訳(メタデータ) (2020-03-23T12:58:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。