論文の概要: Self-Supervised Path Planning in UAV-aided Wireless Networks based on Active Inference
- arxiv url: http://arxiv.org/abs/2403.13827v1
- Date: Wed, 6 Mar 2024 09:58:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 07:07:37.446713
- Title: Self-Supervised Path Planning in UAV-aided Wireless Networks based on Active Inference
- Title(参考訳): アクティブ推論に基づくUAV支援無線ネットワークにおける自己監視経路計画
- Authors: Ali Krayani, Khalid Khan, Lucio Marcenaro, Mario Marchese, Carlo Regazzoni,
- Abstract要約: 本稿では,UAV支援ネットワークのための自己教師付きパスプランニング手法を提案する。
世界モデルを搭載したUAVは、リアルタイムの自律的な決定を行うことができる。
提案手法は,従来のRLに比べて,新しい状況への迅速な適応と性能向上を可能にする。
- 参考スコア(独自算出の注目度): 4.03566545691137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel self-supervised path-planning method for UAV-aided networks. First, we employed an optimizer to solve training examples offline and then used the resulting solutions as demonstrations from which the UAV can learn the world model to understand the environment and implicitly discover the optimizer's policy. UAV equipped with the world model can make real-time autonomous decisions and engage in online planning using active inference. During planning, UAV can score different policies based on the expected surprise, allowing it to choose among alternative futures. Additionally, UAV can anticipate the outcomes of its actions using the world model and assess the expected surprise in a self-supervised manner. Our method enables quicker adaptation to new situations and better performance than traditional RL, leading to broader generalizability.
- Abstract(参考訳): 本稿では,UAV支援ネットワークのための自己教師付き経路計画手法を提案する。
まず、トレーニング例をオフラインで解決するためにオプティマイザを使用し、UAVが世界モデルを学習して環境を理解し、オプティマイザのポリシーを暗黙的に発見するデモとして、結果のソリューションを使用した。
世界モデルを備えたUAVは、リアルタイムの自律的な決定を行い、アクティブな推論を使用してオンライン計画に従事することができる。
計画中、UAVは予想されるサプライズに基づいて異なるポリシーを採り、代替案を選択することができる。
さらに、UAVは世界モデルを用いて行動の結果を予測し、予測されるサプライズを自己監督的に評価することができる。
提案手法は,従来のRLよりも新しい状況への迅速な適応と性能向上を実現し,より広範な一般化を可能にした。
関連論文リスト
- Autonomous Decision Making for UAV Cooperative Pursuit-Evasion Game with Reinforcement Learning [50.33447711072726]
本稿では,マルチロールUAV協調追従ゲームにおける意思決定のための深層強化学習モデルを提案する。
提案手法は,追従回避ゲームシナリオにおけるUAVの自律的意思決定を可能にする。
論文 参考訳(メタデータ) (2024-11-05T10:45:30Z) - Multi-UAV Multi-RIS QoS-Aware Aerial Communication Systems using DRL and PSO [34.951735976771765]
無人航空機(UAV)は、地上の利用者に無線サービスを提供する学術・産業の研究者の注目を集めている。
UAVの限られたリソースは、そのようなアプリケーションにUAVを採用する上での課題を引き起こす可能性がある。
システムモデルでは,地域をナビゲートするUAVスワムを考慮し,RISをサポートした地上ユーザへの無線通信により,UAVのカバレッジを向上させる。
論文 参考訳(メタデータ) (2024-06-16T17:53:56Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Meta Reinforcement Learning for Strategic IoT Deployments Coverage in
Disaster-Response UAV Swarms [5.57865728456594]
無人航空機(UAV)は、重要な緊急用途に使用される可能性があるとして、学術や産業の研究者の注目を集めている。
これらのアプリケーションには、地上のユーザーに無線サービスを提供し、災害の影響を受けた地域からデータを収集する機能が含まれる。
UAVの限られた資源、エネルギー予算、厳格なミッション完了時間は、これらの用途にUAVを採用する際の課題を提起している。
論文 参考訳(メタデータ) (2024-01-20T05:05:39Z) - Muti-Agent Proximal Policy Optimization For Data Freshness in
UAV-assisted Networks [4.042622147977782]
収集したデータが時間に敏感な場合に注目し,そのタイムラインを維持することが重要である。
我々の目標は、UAVの軌道を最適に設計することであり、グローバル・エイジ・オブ・アップデート(AoU)のような訪問するIoTデバイスのサブセットを最小化することである。
論文 参考訳(メタデータ) (2023-03-15T15:03:09Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - 3D UAV Trajectory and Data Collection Optimisation via Deep
Reinforcement Learning [75.78929539923749]
無人航空機(UAV)は現在、無線通信におけるネットワーク性能とカバレッジを高めるために配備され始めている。
UAV支援モノのインターネット(IoT)のための最適な資源配分方式を得ることは困難である
本稿では,UAVの最も短い飛行経路に依存しつつ,IoTデバイスから収集したデータ量を最大化しながら,新しいUAV支援IoTシステムを設計する。
論文 参考訳(メタデータ) (2021-06-06T14:08:41Z) - Efficient UAV Trajectory-Planning using Economic Reinforcement Learning [65.91405908268662]
UAV間でタスクを分散するための経済取引に触発された新しい強化学習アルゴリズムであるREPlannerを紹介します。
エージェントが協力し、リソースを競うことができるマルチエージェント経済ゲームとして、パス計画問題を策定します。
UAV協力によるタスク分布の計算を行うため、Swarmサイズの変化に対して非常に耐性が高い。
論文 参考訳(メタデータ) (2021-03-03T20:54:19Z) - Federated Learning for Cellular-connected UAVs: Radio Mapping and Path
Planning [2.4366811507669124]
本稿では,UAVの走行時間を最小化し,確率的接続制約を満たすことを保証する。
UAVは異なるミッションを持ち、異なるエリアを飛行するため、収集されたデータはネットワークの接続に関するローカル情報を運ぶ。
最初のステップでは、UAVは環境の停止確率のグローバルモデルを構築します。
第2ステップでは、第1ステップで得られた大域的モデルと高速探索型ランダムツリー(RRT)を用いて、UAVの経路を最適化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-23T14:55:37Z) - Artificial Intelligence Aided Next-Generation Networks Relying on UAVs [140.42435857856455]
動的環境において,人工知能(AI)による無人航空機(UAV)による次世代ネットワーク支援が提案されている。
AI対応のUAV支援無線ネットワーク(UAWN)では、複数のUAVが航空基地局として使用され、ダイナミックな環境に迅速に適応することができる。
AIフレームワークの利点として、従来のUAWNのいくつかの課題が回避され、ネットワークパフォーマンスが向上し、信頼性が向上し、アジャイル適応性が向上する。
論文 参考訳(メタデータ) (2020-01-28T15:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。