論文の概要: Short vs. Long-term Coordination of Drones: When Distributed
Optimization Meets Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2311.09852v1
- Date: Thu, 16 Nov 2023 12:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 14:19:35.982536
- Title: Short vs. Long-term Coordination of Drones: When Distributed
Optimization Meets Deep Reinforcement Learning
- Title(参考訳): ドローンの短期対長期協調:分散最適化が深層強化学習と出会うとき
- Authors: Chuhao Qin and Evangelos Pournaras
- Abstract要約: 充電技術をサポートするスマートドローンの群れは、スマートシティーの完全なセンシング機能を提供する。
分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、リチャージを実現するためにドローンを協調することを目的としている。
本稿では,分散最適化に基づく計画と選択を包含する新しいプログレッシブアプローチとDRLに基づく飛行方向スケジューリングを提案する。
- 参考スコア(独自算出の注目度): 1.0878040851637998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Swarms of smart drones, with the support of charging technology, can provide
completing sensing capabilities in Smart Cities, such as traffic monitoring and
disaster response. Existing approaches, including distributed optimization and
deep reinforcement learning (DRL), aim to coordinate drones to achieve
cost-effective, high-quality navigation, sensing, and recharging. However, they
have distinct challenges: short-term optimization struggles to provide
sustained benefits, while long-term DRL lacks scalability, resilience, and
flexibility. To bridge this gap, this paper introduces a new progressive
approach that encompasses the planning and selection based on distributed
optimization, as well as DRL-based flying direction scheduling. Extensive
experiment with datasets generated from realisitic urban mobility demonstrate
the outstanding performance of the proposed solution in traffic monitoring
compared to three baseline methods.
- Abstract(参考訳): 充電技術をサポートするスマートドローンの群れは、交通監視や災害対応といったスマートシティの完全なセンシング機能を提供する。
分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、リチャージを実現するためにドローンを協調することを目的としている。
短期最適化は持続的なメリットを提供するのに苦労するが、長期DRLにはスケーラビリティ、レジリエンス、柔軟性がない。
そこで本稿では,このギャップを埋めるために,分散最適化に基づく計画と選択,およびdrlに基づく飛行方向スケジューリングを包含する新しいプログレッシブアプローチを提案する。
実際の都市移動から生成されたデータセットによる大規模な実験は、3つのベースライン手法と比較して,交通監視における提案手法の優れた性能を示す。
関連論文リスト
- Biologically Inspired Swarm Dynamic Target Tracking and Obstacle Avoidance [0.0]
本研究では、軍用分散ドローン群を用いた動的目標追跡のためのAI駆動飛行コンピュータを提案する。
コントローラはファジィインタフェース、素早い適応、予測能力、マルチエージェント問題解決を可能にするニューラルネットワークを統合する。
論文 参考訳(メタデータ) (2024-10-15T03:47:09Z) - End-to-end Driving in High-Interaction Traffic Scenarios with Reinforcement Learning [24.578178308010912]
これらの問題に対処するために,Ranmble というエンドツーエンドモデルベース RL アルゴリズムを提案する。
環境のダイナミックスモデルを学ぶことで、Rambleは今後のトラフィックイベントを予測し、より情報に富んだ戦略的決定を下すことができる。
Rambleは、CARLA Leaderboard 2.0におけるルート完了率と運転スコアに関する最先端のパフォーマンスを達成し、複雑でダイナミックな交通状況を管理する上での有効性を示している。
論文 参考訳(メタデータ) (2024-10-03T06:45:59Z) - Collaborative Ground-Space Communications via Evolutionary Multi-objective Deep Reinforcement Learning [113.48727062141764]
地中直接通信を実現するために,分散コラボレーティブビームフォーミング(DCB)に基づくアップリンク通信パラダイムを提案する。
DCBは、低軌道(LEO)衛星と効率的な直接接続を確立することができない端末を分散アンテナとして扱う。
本稿では,進化的多目的深層強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:13:02Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Model-Based Reinforcement Learning via Latent-Space Collocation [110.04005442935828]
我々は、行動だけでなく、状態の順序を計画することで、長期的タスクの解決がより容易であると主張する。
我々は、学習された潜在状態空間モデルを利用して、画像に基づく設定に最適な制御文献における長い水平タスクに対する良い結果を示すコロケーションの概念を適応させる。
論文 参考訳(メタデータ) (2021-06-24T17:59:18Z) - Distributed Multi-agent Meta Learning for Trajectory Design in Wireless
Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。
値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文 参考訳(メタデータ) (2020-12-06T01:30:12Z) - Trajectory Planning for Autonomous Vehicles Using Hierarchical
Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。
RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。
軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文 参考訳(メタデータ) (2020-11-09T20:49:54Z) - Multi-UAV Path Planning for Wireless Data Harvesting with Deep
Reinforcement Learning [18.266087952180733]
本稿では,データ収集ミッションを定義するシナリオパラメータの深い変化に適応できるマルチエージェント強化学習(MARL)手法を提案する。
提案するネットワークアーキテクチャにより,データ収集タスクを慎重に分割することで,エージェントが効果的に協調できることを示す。
論文 参考訳(メタデータ) (2020-10-23T14:59:30Z) - UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement
Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。
自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。
提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文 参考訳(メタデータ) (2020-07-01T15:14:16Z) - Spatial-Temporal Transformer Networks for Traffic Flow Forecasting [74.76852538940746]
本稿では,長期交通予測の精度を向上させるため,時空間変圧器ネットワーク(STTN)の新たなパラダイムを提案する。
具体的には、有向空間依存を動的にモデル化することにより、空間変換器と呼ばれる新しいグラフニューラルネットワークを提案する。
提案モデルにより,長期間にわたる空間的依存関係に対する高速かつスケーラブルなトレーニングが可能になる。
論文 参考訳(メタデータ) (2020-01-09T10:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。