論文の概要: Short vs. Long-term Coordination of Drones: When Distributed
Optimization Meets Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2311.09852v1
- Date: Thu, 16 Nov 2023 12:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 14:19:35.982536
- Title: Short vs. Long-term Coordination of Drones: When Distributed
Optimization Meets Deep Reinforcement Learning
- Title(参考訳): ドローンの短期対長期協調:分散最適化が深層強化学習と出会うとき
- Authors: Chuhao Qin and Evangelos Pournaras
- Abstract要約: 充電技術をサポートするスマートドローンの群れは、スマートシティーの完全なセンシング機能を提供する。
分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、リチャージを実現するためにドローンを協調することを目的としている。
本稿では,分散最適化に基づく計画と選択を包含する新しいプログレッシブアプローチとDRLに基づく飛行方向スケジューリングを提案する。
- 参考スコア(独自算出の注目度): 1.0878040851637998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Swarms of smart drones, with the support of charging technology, can provide
completing sensing capabilities in Smart Cities, such as traffic monitoring and
disaster response. Existing approaches, including distributed optimization and
deep reinforcement learning (DRL), aim to coordinate drones to achieve
cost-effective, high-quality navigation, sensing, and recharging. However, they
have distinct challenges: short-term optimization struggles to provide
sustained benefits, while long-term DRL lacks scalability, resilience, and
flexibility. To bridge this gap, this paper introduces a new progressive
approach that encompasses the planning and selection based on distributed
optimization, as well as DRL-based flying direction scheduling. Extensive
experiment with datasets generated from realisitic urban mobility demonstrate
the outstanding performance of the proposed solution in traffic monitoring
compared to three baseline methods.
- Abstract(参考訳): 充電技術をサポートするスマートドローンの群れは、交通監視や災害対応といったスマートシティの完全なセンシング機能を提供する。
分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、リチャージを実現するためにドローンを協調することを目的としている。
短期最適化は持続的なメリットを提供するのに苦労するが、長期DRLにはスケーラビリティ、レジリエンス、柔軟性がない。
そこで本稿では,このギャップを埋めるために,分散最適化に基づく計画と選択,およびdrlに基づく飛行方向スケジューリングを包含する新しいプログレッシブアプローチを提案する。
実際の都市移動から生成されたデータセットによる大規模な実験は、3つのベースライン手法と比較して,交通監視における提案手法の優れた性能を示す。
関連論文リスト
- Meta Reinforcement Learning for Strategic IoT Deployments Coverage in
Disaster-Response UAV Swarms [5.57865728456594]
無人航空機(UAV)は、重要な緊急用途に使用される可能性があるとして、学術や産業の研究者の注目を集めている。
これらのアプリケーションには、地上のユーザーに無線サービスを提供し、災害の影響を受けた地域からデータを収集する機能が含まれる。
UAVの限られた資源、エネルギー予算、厳格なミッション完了時間は、これらの用途にUAVを採用する際の課題を提起している。
論文 参考訳(メタデータ) (2024-01-20T05:05:39Z) - Multi-Objective Optimization for UAV Swarm-Assisted IoT with Virtual
Antenna Arrays [55.736718475856726]
無人航空機(UAV)ネットワークはIoT(Internet-of-Things)を支援するための有望な技術である
既存のUAV支援データ収集および普及スキームでは、UAVはIoTとアクセスポイントの間を頻繁に飛行する必要がある。
協調ビームフォーミングをIoTとUAVに同時に導入し、エネルギーと時間効率のデータ収集と普及を実現した。
論文 参考訳(メタデータ) (2023-08-03T02:49:50Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - Multi-Agent Deep Reinforcement Learning For Optimising Energy Efficiency
of Fixed-Wing UAV Cellular Access Points [3.502112118170715]
固定翼UAVセルアクセスポイントのエネルギー効率を最適化する多エージェント深部強化学習手法を提案する。
提案手法では,UAVの3次元軌道を一連の時間経過で調整できるDueling Deep Q-Network (DDQN) エージェントを備える。
論文 参考訳(メタデータ) (2021-11-03T14:49:17Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z) - Multi-UAV Path Planning for Wireless Data Harvesting with Deep
Reinforcement Learning [18.266087952180733]
本稿では,データ収集ミッションを定義するシナリオパラメータの深い変化に適応できるマルチエージェント強化学習(MARL)手法を提案する。
提案するネットワークアーキテクチャにより,データ収集タスクを慎重に分割することで,エージェントが効果的に協調できることを示す。
論文 参考訳(メタデータ) (2020-10-23T14:59:30Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。