論文の概要: Short vs. Long-term Coordination of Drones: When Distributed
Optimization Meets Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2311.09852v2
- Date: Thu, 25 Jan 2024 08:53:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 17:37:36.145965
- Title: Short vs. Long-term Coordination of Drones: When Distributed
Optimization Meets Deep Reinforcement Learning
- Title(参考訳): ドローンの短期対長期協調:分散最適化が深層強化学習と出会うとき
- Authors: Chuhao Qin and Evangelos Pournaras
- Abstract要約: 自動対話型ドローンの群れは、充電技術をサポートして、スマートシティーに魅力的なセンシング機能を提供する。
分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、充電を実現するためにドローンを協調することを目的としている。
本稿では,分散最適化に基づく短期計画生成と選択と,DRLに基づく飛行方向の長期的戦略的スケジューリングを併用した新しいプログレッシブアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.0878040851637998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Swarms of autonomous interactive drones, with the support of recharging
technology, can provide compelling sensing capabilities in Smart Cities, such
as traffic monitoring and disaster response. Existing approaches, including
distributed optimization and deep reinforcement learning (DRL), aim to
coordinate drones to achieve cost-effective, high-quality navigation, sensing,
and charging. However, they face grand challenges: short-term optimization is
not effective in dynamic environments with unanticipated changes, while
long-term learning lacks scalability, resilience, and flexibility. To bridge
this gap, this paper introduces a new progressive approach that combines
short-term plan generation and selection based on distributed optimization with
a DRL-based long-term strategic scheduling of flying direction. Extensive
experimentation with datasets generated from realistic urban mobility
underscores an outstanding performance of the proposed solution compared to
state-of-the-art. We also provide compelling new insights about the role of
drones density in different sensing missions, the energy safety of drone
operations and how to prioritize investments for key locations of charging
infrastructure.
- Abstract(参考訳): リチャージ技術をサポートする自律型インタラクティブドローンの群れは、交通監視や災害対応といったスマートシティーに魅力的なセンシング機能を提供する。
分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、充電を実現するためにドローンを調整することを目的としている。
短期最適化は予期せぬ変更を伴う動的環境では有効ではないが、長期学習にはスケーラビリティ、レジリエンス、柔軟性が欠けている。
このギャップを埋めるため,本稿では,分散最適化に基づく短期計画生成と選択と,飛行方向のdrlに基づく長期戦略スケジューリングを組み合わせた新しい手法を提案する。
リアルな都市モビリティから生成されたデータセットの広範な実験は、最先端のソリューションに比べて優れた性能を示している。
また、さまざまなセンシングミッションにおけるドローン密度の役割、ドローン運用のエネルギー安全性、充電インフラの重要な場所に対する投資の優先順位付けについて、新たな洞察を与えています。
関連論文リスト
- Meta Reinforcement Learning for Strategic IoT Deployments Coverage in
Disaster-Response UAV Swarms [5.57865728456594]
無人航空機(UAV)は、重要な緊急用途に使用される可能性があるとして、学術や産業の研究者の注目を集めている。
これらのアプリケーションには、地上のユーザーに無線サービスを提供し、災害の影響を受けた地域からデータを収集する機能が含まれる。
UAVの限られた資源、エネルギー予算、厳格なミッション完了時間は、これらの用途にUAVを採用する際の課題を提起している。
論文 参考訳(メタデータ) (2024-01-20T05:05:39Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Multi-Agent Reinforcement Learning for Unmanned Aerial Vehicle
Coordination by Multi-Critic Policy Gradient Optimization [16.6182621419268]
農業、災害管理、捜索および救助活動、商業および軍事用途では、ドローンの艦隊を適用する利点は、自律的に協力する能力に由来します。
本稿では,政策ネットワークの安定的な更新と報酬信号開発における類似性を実現するマルチエージェント強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-12-31T07:00:44Z) - Amortized Q-learning with Model-based Action Proposals for Autonomous
Driving on Highways [10.687104237121408]
トラジェクティブプランナーと組み合わせて、最適な長期運転戦略を学習する強化学習に基づくアプローチを導入する。
局所最適操作をアクションとしてオンラインに生成することにより、無限の低レベル連続アクション空間と、予め定義された標準レーン変更アクションの固定数の限られた柔軟性のバランスをとることができる。
論文 参考訳(メタデータ) (2020-12-06T11:04:40Z) - Distributed Multi-agent Meta Learning for Trajectory Design in Wireless
Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。
値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文 参考訳(メタデータ) (2020-12-06T01:30:12Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Multi-UAV Path Planning for Wireless Data Harvesting with Deep
Reinforcement Learning [18.266087952180733]
本稿では,データ収集ミッションを定義するシナリオパラメータの深い変化に適応できるマルチエージェント強化学習(MARL)手法を提案する。
提案するネットワークアーキテクチャにより,データ収集タスクを慎重に分割することで,エージェントが効果的に協調できることを示す。
論文 参考訳(メタデータ) (2020-10-23T14:59:30Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。