論文の概要: RLaGA: A Reinforcement Learning Augmented Genetic Algorithm For
Searching Real and Diverse Marker-Based Landing Violations
- arxiv url: http://arxiv.org/abs/2310.07378v2
- Date: Thu, 12 Oct 2023 00:49:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:12:41.848006
- Title: RLaGA: A Reinforcement Learning Augmented Genetic Algorithm For
Searching Real and Diverse Marker-Based Landing Violations
- Title(参考訳): RLaGA: 実・異種マーカーに基づくランディング違反検索のための強化学習型遺伝的アルゴリズム
- Authors: Linfeng Liang, Yao Deng, Kye Morton, Valtteri Kallinen, Alice James,
Avishkar Seth, Endrowednes Kuantama, Subhas Mukhopadhyay, Richard Han, Xi
Zheng
- Abstract要約: 安全性を確保するために、実際の世界にデプロイする前に、自動ランディングシステムを完全にテストすることが重要です。
本稿では、強化学習(RL)拡張検索ベースのテストフレームワークであるRLaGAを提案する。
本手法は, 最大22.19%の違反事例を発生し, 発生した違反事例の多様性をほぼ2倍に向上させる。
- 参考スコア(独自算出の注目度): 0.7709288517758135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated landing for Unmanned Aerial Vehicles (UAVs), like multirotor
drones, requires intricate software encompassing control algorithms, obstacle
avoidance, and machine vision, especially when landing markers assist. Failed
landings can lead to significant costs from damaged drones or payloads and the
time spent seeking alternative landing solutions. Therefore, it's important to
fully test auto-landing systems through simulations before deploying them in
the real-world to ensure safety. This paper proposes RLaGA, a reinforcement
learning (RL) augmented search-based testing framework, which constructs
diverse and real marker-based landing cases that involve safety violations.
Specifically, RLaGA introduces a genetic algorithm (GA) to conservatively
search for diverse static environment configurations offline and RL to
aggressively manipulate dynamic objects' trajectories online to find potential
vulnerabilities in the target deployment environment. Quantitative results
reveal that our method generates up to 22.19% more violation cases and nearly
doubles the diversity of generated violation cases compared to baseline
methods. Qualitatively, our method can discover those corner cases which would
be missed by state-of-the-art algorithms. We demonstrate that select types of
these corner cases can be confirmed via real-world testing with drones in the
field.
- Abstract(参考訳): マルチロータードローンのような無人航空機(uav)の自動着陸には、制御アルゴリズム、障害物回避、および特に着陸マーカーが補助する機械ビジョンを含む複雑なソフトウェアが必要である。
着陸に失敗した場合、損傷したドローンやペイロードからかなりのコストがかかり、代替の着陸ソリューションを探すのに費やされる。
そのため,安全性を確保するために,シミュレーションを通じて自動着陸システムを完全にテストすることが重要である。
本稿では,RLaGAを提案する。RLaGAは,安全違反を含む多種多様なマーカーベースのランディングケースを構築する,強化学習(RL)拡張検索ベースのテストフレームワークである。
具体的には、RLaGAは、さまざまな静的環境構成をオフラインで保存的に検索する遺伝的アルゴリズム(GA)を導入し、RLは、動的オブジェクトの軌道をオンラインで積極的に操作して、ターゲットデプロイメント環境の潜在的な脆弱性を見つける。
定量的結果から,本手法では最大22.19%の違反事例が生成され,また,基準法と比較してほぼ2倍の多様性が得られた。
定性的に、この手法は最先端のアルゴリズムで見逃されるようなコーナーケースを発見できる。
これらのコーナーケースの特定のタイプは、現場のドローンによる実地テストによって確認可能であることを実証する。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - PAFOT: A Position-Based Approach for Finding Optimal Tests of Autonomous Vehicles [4.243926243206826]
本稿では位置に基づくアプローチテストフレームワークであるPAFOTを提案する。
PAFOTは、自動走行システムの安全違反を明らかにするために、敵の運転シナリオを生成する。
PAFOTはADSをクラッシュさせる安全クリティカルなシナリオを効果的に生成し、短いシミュレーション時間で衝突を見つけることができることを示す実験である。
論文 参考訳(メタデータ) (2024-05-06T10:04:40Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - DARTH: Holistic Test-time Adaptation for Multiple Object Tracking [87.72019733473562]
複数物体追跡(MOT)は、自律運転における知覚システムの基本的構成要素である。
運転システムの安全性の追求にもかかわらず、テスト時間条件における領域シフトに対するMOT適応問題に対する解決策は提案されていない。
我々はMOTの総合的なテスト時間適応フレームワークであるDARTHを紹介する。
論文 参考訳(メタデータ) (2023-10-03T10:10:42Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Adaptive Failure Search Using Critical States from Domain Experts [9.93890332477992]
フェールサーチは、シミュレーションまたは実世界のテストにおいて、かなりの走行距離をロギングすることで行うことができる。
ASTはマルコフ決定プロセスとして失敗探索の問題を提起する手法である。
ASTフレームワークにクリティカルステートを組み込むことで,安全性違反の増大を伴う障害シナリオが生成されることを示す。
論文 参考訳(メタデータ) (2023-04-01T18:14:41Z) - Unsupervised Adaptation from Repeated Traversals for Autonomous Driving [54.59577283226982]
自動運転車はエンドユーザー環境に一般化し、確実に動作させなければならない。
潜在的な解決策の1つは、エンドユーザの環境から収集されたラベルのないデータを活用することである。
適応過程を監督する信頼性のある信号はターゲット領域に存在しない。
この単純な仮定は、ターゲット領域上の3次元物体検出器の反復的自己学習を可能にする強力な信号を得るのに十分であることを示す。
論文 参考訳(メタデータ) (2023-03-27T15:07:55Z) - Analyzing Robustness of the Deep Reinforcement Learning Algorithm in
Ramp Metering Applications Considering False Data Injection Attack and
Defense [0.0]
ランプメータリング(英語: Ramp metering)は、高速道路の本線への車両の走行を制御する行為である。
深部Q-Learningアルゴリズムは,ループ検出情報のみを入力として利用する。
モデルは、道路のジオメトリーやレイアウトに関わらず、ほぼすべてのランプ計測サイトに応用できる。
論文 参考訳(メタデータ) (2023-01-28T00:40:46Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - Towards Automated Safety Coverage and Testing for Autonomous Vehicles
with Reinforcement Learning [0.3683202928838613]
検証は、システムが日々の運転で遭遇する可能性のあるシナリオや状況において、自動運転車システムをテストに投入する。
本稿では,AVソフトウェア実装における障害事例と予期せぬ交通状況を生成するために強化学習(RL)を提案する。
論文 参考訳(メタデータ) (2020-05-22T19:00:38Z) - Search-based Test-Case Generation by Monitoring Responsibility Safety
Rules [2.1270496914042996]
本研究では,シミュレーションに基づく運転テストデータのスクリーニングと分類を行う手法を提案する。
本フレームワークは,S-TALIROおよびSim-ATAVツールとともに配布されている。
論文 参考訳(メタデータ) (2020-04-25T10:10:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。