論文の概要: Deep Reinforcement Learning for Safe Landing Site Selection with
Concurrent Consideration of Divert Maneuvers
- arxiv url: http://arxiv.org/abs/2102.12432v1
- Date: Wed, 24 Feb 2021 17:53:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 19:15:33.946997
- Title: Deep Reinforcement Learning for Safe Landing Site Selection with
Concurrent Consideration of Divert Maneuvers
- Title(参考訳): ダイバート操作を考慮した安全な着陸地点選択のための深層補強学習
- Authors: Keidai Iiyama, Kento Tomita, Bhavi A. Jagatia, Tatsuwaki Nakagawa and
Koki Ho
- Abstract要約: 本研究は、安全な着陸場所を特定し、機内転位操作を計画するための新しい統合フレームワークを提案する。
提案されたフレームワークは、高度に挑戦する着陸地点で94.8ドルの着陸に成功した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research proposes a new integrated framework for identifying safe
landing locations and planning in-flight divert maneuvers. The state-of-the-art
algorithms for landing zone selection utilize local terrain features such as
slopes and roughness to judge the safety and priority of the landing point.
However, when there are additional chances of observation and diverting in the
future, these algorithms are not able to evaluate the safety of the decision
itself to target the selected landing point considering the overall descent
trajectory. In response to this challenge, we propose a reinforcement learning
framework that optimizes a landing site selection strategy concurrently with a
guidance and control strategy to the target landing site. The trained agent
could evaluate and select landing sites with explicit consideration of the
terrain features, quality of future observations, and control to achieve a safe
and efficient landing trajectory at a system-level. The proposed framework was
able to achieve 94.8 $\%$ of successful landing in highly challenging landing
sites where over 80$\%$ of the area around the initial target lading point is
hazardous, by effectively updating the target landing site and feedback control
gain during descent.
- Abstract(参考訳): 本研究は、安全な着陸場所を特定し、機内転位操作を計画するための新しい統合フレームワークを提案する。
ランディングゾーン選択のための最先端アルゴリズムは、斜面や粗さなどの地形特性を利用して、ランディングポイントの安全性と優先順位を判断する。
しかし、将来さらなる観測と分岐の機会がある場合、これらのアルゴリズムは、降下経路全体を考慮して、選択された着陸地点をターゲットにする決定自体の安全性を評価することができない。
そこで本研究では,着陸地点選定戦略と目標着陸地点への誘導・制御戦略を並行して最適化する強化学習フレームワークを提案する。
訓練されたエージェントは、地形の特徴、将来の観測の質、およびシステムレベルで安全かつ効率的な着陸軌道を達成するための制御を明確に考慮して着陸地点を評価し、選択することができた。
提案手法は、目標着地地点を効果的に更新し、降下時のフィードバック制御ゲインを付与することにより、初期目標着地地点周辺の80$_%$を危険にさらす高度に困難な着地地点において94.8ドル$%の着陸に成功した。
関連論文リスト
- Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.84996994779443]
本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。
我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。
挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2024-07-08T12:52:46Z) - Improving Point-based Crowd Counting and Localization Based on Auxiliary Point Guidance [59.71186244597394]
本稿では,提案手法における提案対象マッチングの安定化に有効な手法を提案する。
本稿では,提案手法の選択と最適化のために,Auxiliary Point Guidance (APG)を提案する。
また,多様な群集シナリオにおける適応的特徴抽出を可能にするために,IFI(Implicit Feature Interpolation)を開発した。
論文 参考訳(メタデータ) (2024-05-17T07:23:27Z) - Secure Navigation using Landmark-based Localization in a GPS-denied
Environment [1.19658449368018]
本稿では,ランドマークに基づくローカライゼーション(LanBLoc)と拡張カルマンフィルタ(EKF)を統合した新たなフレームワークを提案する。
本稿では,障害物や危険のない経路を移動する物体を誘導する2つのアプローチについて,シミュレーションした戦場シナリオを提案する。
論文 参考訳(メタデータ) (2024-02-22T04:41:56Z) - Visual Environment Assessment for Safe Autonomous Quadrotor Landing [8.538463567092297]
本研究では,安全な四段着陸のための着陸地点の検出と評価を行う新しい手法を提案する。
本ソリューションは,GPSなどの外部支援を不要にしながら,2次元および3次元環境情報を効率的に統合する。
提案手法は,計算能力に制限のあるクオータ上でリアルタイムに実行される。
論文 参考訳(メタデータ) (2023-11-16T18:02:10Z) - HALO: Hazard-Aware Landing Optimization for Autonomous Systems [1.5414037351414311]
本稿では,ハザード検出,最適着陸軌道生成,緊急計画課題に対処する認識計画手法を提案する。
本研究では,HALSS(Hazard-Aware Landing Site Selection)とAdaptive Deferred-Decision Trajectory Optimization(Adaptive Deferred-Decision Trajectory Optimization,-DDTO)という2つの新しいアルゴリズムを開発し,統合し,認識と計画の課題に対処する。
シミュレーションした火星環境を用いたアプローチの有効性を実証し, 組み合わせた認識計画法が着地成功率を高めることを示す。
論文 参考訳(メタデータ) (2023-04-04T07:20:06Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Detection and Initial Assessment of Lunar Landing Sites Using Neural
Networks [0.0]
本稿では、誘導システムにおける着陸可能地域の初期評価を生成するために、受動的自律型ハザード検出と回避サブシステムに焦点を当てる。
このシステムは単一のカメラとMobileNetV2ニューラルネットワークアーキテクチャを使って、安全な着陸地点と岩や影、クレーターなどの危険を検知し、識別する。
論文 参考訳(メタデータ) (2022-07-23T04:29:18Z) - Uncertainty-driven Planner for Exploration and Navigation [36.933903274373336]
未確認環境における探索とポイントゴールナビゲーションの問題点を考察する。
本論では,屋内マップよりも先進的な学習が,これらの問題に対処する上で大きなメリットをもたらすと論じている。
本稿では、まず、エージェントの視野を超えた占有マップを生成することを学習する新しい計画フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-24T05:25:31Z) - Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation [78.17108227614928]
本研究では,水文ナビゲーションに着目した安全強化学習のためのベンチマーク環境を提案する。
価値に基づく政策段階の深層強化学習(DRL)について考察する。
また,学習したモデルの振る舞いを所望の特性の集合上で検証する検証戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T16:53:56Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。