Fugu-MT 論文翻訳(概要): Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning

論文の概要: Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2311.09852v2
Date: Thu, 25 Jan 2024 08:53:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-26 17:37:36.145965
Title: Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning
Title（参考訳）: ドローンの短期対長期協調:分散最適化が深層強化学習と出会うとき
Authors: Chuhao Qin and Evangelos Pournaras
Abstract要約: 自動対話型ドローンの群れは、充電技術をサポートして、スマートシティーに魅力的なセンシング機能を提供する。分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、充電を実現するためにドローンを協調することを目的としている。本稿では,分散最適化に基づく短期計画生成と選択と,DRLに基づく飛行方向の長期的戦略的スケジューリングを併用した新しいプログレッシブアプローチを提案する。
参考スコア（独自算出の注目度）: 1.0878040851637998
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Swarms of autonomous interactive drones, with the support of recharging technology, can provide compelling sensing capabilities in Smart Cities, such as traffic monitoring and disaster response. Existing approaches, including distributed optimization and deep reinforcement learning (DRL), aim to coordinate drones to achieve cost-effective, high-quality navigation, sensing, and charging. However, they face grand challenges: short-term optimization is not effective in dynamic environments with unanticipated changes, while long-term learning lacks scalability, resilience, and flexibility. To bridge this gap, this paper introduces a new progressive approach that combines short-term plan generation and selection based on distributed optimization with a DRL-based long-term strategic scheduling of flying direction. Extensive experimentation with datasets generated from realistic urban mobility underscores an outstanding performance of the proposed solution compared to state-of-the-art. We also provide compelling new insights about the role of drones density in different sensing missions, the energy safety of drone operations and how to prioritize investments for key locations of charging infrastructure.
Abstract（参考訳）: リチャージ技術をサポートする自律型インタラクティブドローンの群れは、交通監視や災害対応といったスマートシティーに魅力的なセンシング機能を提供する。分散最適化と深層強化学習(DRL)を含む既存のアプローチは、コスト効率が高く高品質なナビゲーション、センシング、充電を実現するためにドローンを調整することを目的としている。短期最適化は予期せぬ変更を伴う動的環境では有効ではないが、長期学習にはスケーラビリティ、レジリエンス、柔軟性が欠けている。このギャップを埋めるため,本稿では,分散最適化に基づく短期計画生成と選択と,飛行方向のdrlに基づく長期戦略スケジューリングを組み合わせた新しい手法を提案する。リアルな都市モビリティから生成されたデータセットの広範な実験は、最先端のソリューションに比べて優れた性能を示している。また、さまざまなセンシングミッションにおけるドローン密度の役割、ドローン運用のエネルギー安全性、充電インフラの重要な場所に対する投資の優先順位付けについて、新たな洞察を与えています。

関連論文リスト

PACEvolve: Enabling Long-Horizon Progress-Aware Consistent Evolution [64.15555230987222]
PACEvolveはエージェントのコンテキストと検索ダイナミクスを堅牢に管理するように設計されたフレームワークである。 PACEvolveは、一貫性のある長期自己改善のための体系的なパスを提供する。
論文参考訳（メタデータ） (2026-01-15T18:25:23Z)
Hybrid Motion Planning with Deep Reinforcement Learning for Mobile Robot Navigation [0.0]
深部強化学習(HMP-DRL)によるハイブリッド運動計画状態空間と報酬関数の両方に符号化されたチェックポイントのシーケンスを通じて、局所DRLポリシーに統合されたパスを生成するグラフベースのグローバルプランナを提案する。社会的コンプライアンスを確保するため、地域プランナーは、周辺エージェントのセマンティックタイプに基づいて、安全マージンと罰則を動的に調整するエンティティ対応報酬構造を採用する。
論文参考訳（メタデータ） (2025-12-31T05:58:57Z)
Trajectory Design for UAV-Based Low-Altitude Wireless Networks in Unknown Environments: A Digital Twin-Assisted TD3 Approach [62.11847362756054]
低高度無線ネットワーク(LAWN)のキーイネーブラーとして無人航空機(UAV)が登場している我々は、デジタルツイン(DT)支援トレーニングおよびデプロイメントフレームワークを提案する。このフレームワークでは、UAVは統合されたセンシングと通信信号を送信し、地上ユーザーに通信サービスを提供し、同時にDTサーバにアップロードされたエコーを収集して、仮想環境(VE)を段階的に構築する。これらのVEはモデルトレーニングを加速し、展開中のリアルタイムUAVセンシングデータを継続的に更新し、意思決定をサポートし、飛行安全性を向上する。
論文参考訳（メタデータ） (2025-10-28T10:05:53Z)
TD-JEPA: Latent-predictive Representations for Zero-Shot Reinforcement Learning [63.73629127832652]
本稿では,TDに基づく潜在予測表現を教師なしRLに活用するTD-JEPAを紹介する。 TD-JEPAは、明示的な状態とタスクエンコーダ、ポリシー条件付きマルチステップ予測器、パラメータ化されたポリシーのセットを潜時空間で直接訓練する。実証的には、TD-JEPAは13のデータセットにわたる移動、ナビゲーション、操作のタスクにおいて、最先端のベースラインをマッチまたは上回る。
論文参考訳（メタデータ） (2025-10-01T10:21:18Z)
Age of Information Minimization in UAV-Enabled Integrated Sensing and Communication Systems [34.92822911897626]
統合センシング通信(ISAC)機能を備えた無人航空機(UAV)は、将来の無線ネットワークにおいて重要な役割を果たすと想定されている。ターゲットセンシングとマルチユーザ通信を同時に行う老化情報(AoI)システムを提案する。
論文参考訳（メタデータ） (2025-07-18T18:17:09Z)
Improved particle swarm optimization algorithm: multi-target trajectory optimization for swarm drones [20.531764063763678]
従来のParticle Swarm Optimization (PSO) 手法は、リアルタイムシナリオにおける早期収束と遅延に苦慮している。 PSOベースのオンライントラジェクトリプランナであるPE-PSOを提案する。遺伝的アルゴリズム(GA)に基づくタスク割り当てと分散PE-PSOを組み合わせたマルチエージェントフレームワークを開発した。
論文参考訳（メタデータ） (2025-07-18T04:31:49Z)
World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。 mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文参考訳（メタデータ） (2025-05-03T06:23:18Z)
Deep Reinforcement Learning based Autonomous Decision-Making for Cooperative UAVs: A Search and Rescue Real World Application [3.206131271136423]
本稿では, 自律誘導, ナビゲーション, タスク分散のための総合的な枠組みを提案する。我々は,2つの遅延型Deep Deterministic Policy Gradientアルゴリズムを利用して,DRLに基づく指導機構を提唱する。 DRL学習グラフ畳み込みネットワーク(GCN)による協調型UAV間のタスク分散問題に取り組む。
論文参考訳（メタデータ） (2025-02-27T17:53:16Z)
Real-Time Sampling-based Online Planning for Drone Interception [18.340019191662957]
本稿では,ニューラルネットワークの推論を利用して,時間を要する非線形軌道最適化を代替するサンプリングベースのオンライン計画アルゴリズムを提案する。提案手法は、無人機が衝突を回避し、不完全な目標予測を処理しながら、目標を迎撃しなければならないドローン迎撃問題に適用される。
論文参考訳（メタデータ） (2025-02-20T03:48:38Z)
A Cross-Scene Benchmark for Open-World Drone Active Tracking [54.235808061746525]
Drone Visual Active Trackingは、視覚的な観察に基づいてモーションシステムを制御することで、対象物を自律的に追跡することを目的としている。 DATと呼ばれるオープンワールドドローンアクティブトラッキングのためのクロスシーンクロスドメインベンチマークを提案する。また、R-VATと呼ばれる強化学習に基づくドローン追跡手法を提案する。
論文参考訳（メタデータ） (2024-12-01T09:37:46Z)
SCoTT: Wireless-Aware Path Planning with Vision Language Models and Strategic Chains-of-Thought [78.53885607559958]
複雑な無線環境における経路計画を実現するために,視覚言語モデル(VLM)を用いた新しい手法を提案する。この目的のために、実世界の無線レイトレーシングデータを用いたデジタルツインからの洞察を探索する。その結果, SCoTT はDP-WA* と比較して非常に近い平均経路ゲインを実現し, 同時に一貫した経路長が得られることがわかった。
論文参考訳（メタデータ） (2024-11-27T10:45:49Z)
Biologically Inspired Swarm Dynamic Target Tracking and Obstacle Avoidance [0.0]
本研究では、軍用分散ドローン群を用いた動的目標追跡のためのAI駆動飛行コンピュータを提案する。コントローラはファジィインタフェース、素早い適応、予測能力、マルチエージェント問題解決を可能にするニューラルネットワークを統合する。
論文参考訳（メタデータ） (2024-10-15T03:47:09Z)
End-to-end Driving in High-Interaction Traffic Scenarios with Reinforcement Learning [24.578178308010912]
これらの問題に対処するために,Ranmble というエンドツーエンドモデルベース RL アルゴリズムを提案する。環境のダイナミックスモデルを学ぶことで、Rambleは今後のトラフィックイベントを予測し、より情報に富んだ戦略的決定を下すことができる。 Rambleは、CARLA Leaderboard 2.0におけるルート完了率と運転スコアに関する最先端のパフォーマンスを達成し、複雑でダイナミックな交通状況を管理する上での有効性を示している。
論文参考訳（メタデータ） (2024-10-03T06:45:59Z)
Collaborative Ground-Space Communications via Evolutionary Multi-objective Deep Reinforcement Learning [113.48727062141764]
地中直接通信を実現するために,分散コラボレーティブビームフォーミング(DCB)に基づくアップリンク通信パラダイムを提案する。 DCBは、低軌道(LEO)衛星と効率的な直接接続を確立することができない端末を分散アンテナとして扱う。本稿では,進化的多目的深層強化学習アルゴリズムを提案する。
論文参考訳（メタデータ） (2024-04-11T03:13:02Z)
Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文参考訳（メタデータ） (2022-10-28T05:30:49Z)
Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文参考訳（メタデータ） (2021-11-23T18:24:47Z)
Model-Based Reinforcement Learning via Latent-Space Collocation [110.04005442935828]
我々は、行動だけでなく、状態の順序を計画することで、長期的タスクの解決がより容易であると主張する。我々は、学習された潜在状態空間モデルを利用して、画像に基づく設定に最適な制御文献における長い水平タスクに対する良い結果を示すコロケーションの概念を適応させる。
論文参考訳（メタデータ） (2021-06-24T17:59:18Z)
Distributed Multi-agent Meta Learning for Trajectory Design in Wireless Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文参考訳（メタデータ） (2020-12-06T01:30:12Z)
Trajectory Planning for Autonomous Vehicles Using Hierarchical Reinforcement Learning [21.500697097095408]
不確実かつ動的条件下で安全な軌道を計画することは、自律運転問題を著しく複雑にする。 RRT(Rapidly Exploring Random Trees)のような現在のサンプリングベース手法は、高い計算コストのため、この問題には理想的ではない。軌道計画のための階層型強化学習構造とPID(Proportional-Integral-Derivative)コントローラを提案する。
論文参考訳（メタデータ） (2020-11-09T20:49:54Z)
Multi-UAV Path Planning for Wireless Data Harvesting with Deep Reinforcement Learning [18.266087952180733]
本稿では,データ収集ミッションを定義するシナリオパラメータの深い変化に適応できるマルチエージェント強化学習(MARL)手法を提案する。提案するネットワークアーキテクチャにより,データ収集タスクを慎重に分割することで,エージェントが効果的に協調できることを示す。
論文参考訳（メタデータ） (2020-10-23T14:59:30Z)
UAV Path Planning for Wireless Data Harvesting: A Deep Reinforcement Learning Approach [18.266087952180733]
本稿では,IoT(Internet of Things)デバイスからのUAV対応データ収集に対するエンドツーエンド強化学習手法を提案する。自律ドローンは、限られた飛行時間と障害物回避を受ける分散センサーノードからデータを収集する。提案するネットワークアーキテクチャにより,エージェントが様々なシナリオパラメータの移動決定を行うことができることを示す。
論文参考訳（メタデータ） (2020-07-01T15:14:16Z)
Spatial-Temporal Transformer Networks for Traffic Flow Forecasting [74.76852538940746]
本稿では,長期交通予測の精度を向上させるため,時空間変圧器ネットワーク(STTN)の新たなパラダイムを提案する。具体的には、有向空間依存を動的にモデル化することにより、空間変換器と呼ばれる新しいグラフニューラルネットワークを提案する。提案モデルにより,長期間にわたる空間的依存関係に対する高速かつスケーラブルなトレーニングが可能になる。
論文参考訳（メタデータ） (2020-01-09T10:21:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。