論文の概要: Deep Reinforcement Learning-Based Approach for a Single Vehicle Persistent Surveillance Problem with Fuel Constraints
- arxiv url: http://arxiv.org/abs/2404.06423v1
- Date: Tue, 9 Apr 2024 16:14:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 14:01:33.825481
- Title: Deep Reinforcement Learning-Based Approach for a Single Vehicle Persistent Surveillance Problem with Fuel Constraints
- Title(参考訳): 燃料制約付き単一車両監視問題に対する深部強化学習に基づくアプローチ
- Authors: Hritik Bana, Manav Mishra, Saswata Sarkar, Sujeevraja Sanjeevi, Sujit PB, Kaarthik Sundar,
- Abstract要約: 永続的な監視任務では、1機の無人航空機が同じ優先順位で標的のセットを何度も訪問する必要がある。
燃料や飛行時間制限のため、車両は定期的に燃料を補給するか、あるいは補給所で電池を充電する必要がある。
この問題に対処するための深層強化学習に基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.32985979395737786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article presents a deep reinforcement learning-based approach to tackle a persistent surveillance mission requiring a single unmanned aerial vehicle initially stationed at a depot with fuel or time-of-flight constraints to repeatedly visit a set of targets with equal priority. Owing to the vehicle's fuel or time-of-flight constraints, the vehicle must be regularly refueled, or its battery must be recharged at the depot. The objective of the problem is to determine an optimal sequence of visits to the targets that minimizes the maximum time elapsed between successive visits to any target while ensuring that the vehicle never runs out of fuel or charge. We present a deep reinforcement learning algorithm to solve this problem and present the results of numerical experiments that corroborate the effectiveness of this approach in comparison with common-sense greedy heuristics.
- Abstract(参考訳): 本稿では,無人航空機を燃料や飛行時間の制約で基地に配備し,目標のセットを同じ優先度で繰り返し訪問することを必要とする,永続的な監視任務に取り組むための深層強化学習に基づくアプローチを提案する。
燃料や飛行時間制限のため、車両は定期的に燃料を補給するか、あるいは補給所で電池を充電する必要がある。
問題の目的は、車両が燃料や電荷を使い果たさないことを確実にしながら、あらゆる目標への連続的な訪問の間に経過する最大時間を最小限に抑える、目標への訪問の最適な順序を決定することである。
本稿では,この問題を解決するための深層強化学習アルゴリズムを提案する。また,この手法の有効性を,常識的な経験的ヒューリスティックスと比較した数値実験の結果を示す。
関連論文リスト
- Multi-Start Team Orienteering Problem for UAS Mission Re-Planning with
Data-Efficient Deep Reinforcement Learning [9.877261093287304]
我々は、当初車両が補給所から離れた場所にあり、燃料の量が異なるミッション再計画問題について検討する。
そこで我々は,各部分ツアーに対する自己注意と,部分ツアーと残りのノード間のエンコーダ・デコーダの注意を組み込んだポリシーネットワークを構築した。
本稿では,複数の非重複サンプルのロールアウトに基づく局所的なミニバッチベースラインに,グリーディロールアウトベースラインを置き換えたREINFORCEアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-03-02T15:15:56Z) - Vehicle Fault-Tolerant Robust Power Transmission Line Inspection
Planning [8.202492922523591]
本稿では,旅行セールスマン問題の一般化として,耐故障性送電線検査計画について述べる。
対処された点検計画問題は、点検車両が点検時間を制限するバッテリー予算に制約されるような、単座の複数点検シナリオとして定式化される。
様々なコスト関数を持つメタヒューリスティックアルゴリズムは、検査中に計画と高速な再計画に使用される。
論文 参考訳(メタデータ) (2023-02-02T15:39:57Z) - Early Recall, Late Precision: Multi-Robot Semantic Object Mapping under
Operational Constraints in Perceptually-Degraded Environments [47.917640567924174]
本稿では,この問題を解決するためにEarly Recall, Late Precision (EaRLaP)意味オブジェクトマッピングパイプラインを提案する。
EaRLaPはDARPA Subterranean ChallengeでTeam CoSTARによって使用された。
各種データセット上でのEaRLaPの結果と性能について論じる。
論文 参考訳(メタデータ) (2022-06-21T01:11:42Z) - Scalable Vehicle Re-Identification via Self-Supervision [66.2562538902156]
自動車再同定は、都市規模の車両分析システムにおいて重要な要素の1つである。
車両再設計のための最先端のソリューションの多くは、既存のre-idベンチマークの精度向上に重点を置いており、計算の複雑さを無視することが多い。
推論時間に1つのネットワークのみを使用する自己教師型学習によって、シンプルで効果的なハイブリッドソリューションを提案する。
論文 参考訳(メタデータ) (2022-05-16T12:14:42Z) - A Reinforcement Learning Approach for Electric Vehicle Routing Problem
with Vehicle-to-Grid Supply [2.6066825041242367]
EVルーティングに強化学習(RL)を用いたQuikRouteFinderを提案する。
RLの結果は混合整数線形プログラム(MILP)と遺伝的アルゴリズム(GA)のメタヒューリスティックスに基づく正確な定式化と比較される。
論文 参考訳(メタデータ) (2022-04-12T06:13:06Z) - Deep Reinforcement Learning for Solving the Heterogeneous Capacitated
Vehicle Routing Problem [13.389057146418056]
現実のシナリオにおける車両は、その能力(または走行速度)に影響を与える異なる特徴を持つ異種である可能性が高い
異種艦隊制約を考慮した車両選択デコーダと経路構成を考慮したノード選択デコーダとを併用した注意機構に基づくDRL手法を提案し,各ステップで車両とノードの両方を自動的に選択して解を構築することを学習する。
論文 参考訳(メタデータ) (2021-10-06T10:05:19Z) - Real Time Monocular Vehicle Velocity Estimation using Synthetic Data [78.85123603488664]
移動車に搭載されたカメラから車両の速度を推定する問題を考察する。
そこで本研究では,まずオフ・ザ・シェルフ・トラッカーを用いて車両バウンディングボックスを抽出し,その後,小型ニューラルネットワークを用いて車両速度を回帰する2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2021-09-16T13:10:27Z) - Time-Optimal Planning for Quadrotor Waypoint Flight [50.016821506107455]
立方体の作動限界における時間-最適軌道の計画は未解決の問題である。
四重項のアクチュエータポテンシャルをフル活用する解を提案する。
我々は、世界最大規模のモーションキャプチャーシステムにおいて、実世界の飛行における我々の方法を検証する。
論文 参考訳(メタデータ) (2021-08-10T09:26:43Z) - Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits [71.28712804110974]
本稿では,UAVの切断時間,ハンドオーバ速度,エネルギー消費を低減するため,MAB(Multi-armed bandit)アルゴリズムを提案する。
それぞれの性能指標(PI)が、適切な学習パラメータの範囲を採用することにより、どのように改善されるかを示す。
論文 参考訳(メタデータ) (2020-09-21T12:35:23Z) - When Do Drivers Concentrate? Attention-based Driver Behavior Modeling
With Deep Reinforcement Learning [8.9801312307912]
本研究では,運転者の行動を観察に基づいて近似し,運転者の注意度を計測するアクタ批判手法を提案する。
反応時間を考慮してアクターネットワークにアテンション機構を構築し,連続した観測の時間的依存性を捉える。
実世界の車両軌道データを用いて実験を行い,提案手法の精度が7つのベースラインアルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2020-02-26T09:56:36Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。