論文の概要: A Reinforcement Learning Environment for Multi-Service UAV-enabled
Wireless Systems
- arxiv url: http://arxiv.org/abs/2105.05094v1
- Date: Tue, 11 May 2021 14:45:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-12 13:45:09.747235
- Title: A Reinforcement Learning Environment for Multi-Service UAV-enabled
Wireless Systems
- Title(参考訳): マルチサービスUAV対応無線システムの強化学習環境
- Authors: Damiano Brunori, Stefania Colonnese, Francesca Cuomo and Luca Iocchi
- Abstract要約: 我々は、様々なアプリケーションコンテキストで異なる通信サービスを提供する自律型UAVのための多目的環境を設計する。
我々は,実運用環境の異なる特性をシミュレートするために,openai gymフレームワークに基づく環境を開発する。
結果のポリシーの品質は、システムを評価するための単純なベースラインと比較され、さまざまなユースケースでこの技術を採用するためのガイドラインを導き出します。
- 参考スコア(独自算出の注目度): 4.0393766449982085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We design a multi-purpose environment for autonomous UAVs offering different
communication services in a variety of application contexts (e.g., wireless
mobile connectivity services, edge computing, data gathering). We develop the
environment, based on OpenAI Gym framework, in order to simulate different
characteristics of real operational environments and we adopt the Reinforcement
Learning to generate policies that maximize some desired performance.The
quality of the resulting policies are compared with a simple baseline to
evaluate the system and derive guidelines to adopt this technique in different
use cases. The main contribution of this paper is a flexible and extensible
OpenAI Gym environment, which allows to generate, evaluate, and compare
policies for autonomous multi-drone systems in multi-service applications. This
environment allows for comparative evaluation and benchmarking of different
approaches in a variety of application contexts.
- Abstract(参考訳): 我々は、様々なアプリケーション環境(例えば、無線モバイル接続サービス、エッジコンピューティング、データ収集など)で異なる通信サービスを提供する自律型UAVのための多目的環境を設計する。
我々は,実運用環境の異なる特性をシミュレートするために,openai gymフレームワークを基盤とした環境を開発し,強化学習を応用して所望の性能を最大化するポリシを生成し,システム評価のための簡単なベースラインと比較し,その手法を異なるユースケースで採用するためのガイドラインを導出する。
本稿の主な貢献は、マルチサービスアプリケーションにおける自律型マルチドローンシステムのポリシーの生成、評価、比較を可能にする、柔軟で拡張可能なOpenAI Gym環境である。
この環境は様々なアプリケーションコンテキストにおける異なるアプローチの比較評価とベンチマークを可能にします。
関連論文リスト
- UAV-assisted Distributed Learning for Environmental Monitoring in Rural Environments [2.594420805049218]
本稿では,無人航空機(UAV)を地域におけるIoT環境モニタリングのカバレッジ拡張中継として活用する,革新的なアプローチを提案する。
提案手法は,エッジデバイス,UAV,サーバ間のスプリットラーニング(SL)戦略を統合し,推論機構の適応性と性能を向上させる。
論文 参考訳(メタデータ) (2024-07-02T22:21:03Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Multi-UAV Multi-RIS QoS-Aware Aerial Communication Systems using DRL and PSO [34.951735976771765]
無人航空機(UAV)は、地上の利用者に無線サービスを提供する学術・産業の研究者の注目を集めている。
UAVの限られたリソースは、そのようなアプリケーションにUAVを採用する上での課題を引き起こす可能性がある。
システムモデルでは,地域をナビゲートするUAVスワムを考慮し,RISをサポートした地上ユーザへの無線通信により,UAVのカバレッジを向上させる。
論文 参考訳(メタデータ) (2024-06-16T17:53:56Z) - Invariant Causal Imitation Learning for Generalizable Policies [87.51882102248395]
Invariant Causal Learning (ICIL) を提案する。
ICILはノイズ変数の特定の表現から切り離された因果的特徴の表現を学習する。
ICILは、目に見えない環境に一般化可能な模倣ポリシーの学習に有効であることを示す。
論文 参考訳(メタデータ) (2023-11-02T16:52:36Z) - Cross-Domain Policy Adaptation via Value-Guided Data Filtering [57.62692881606099]
動的ミスマッチで異なるドメインにまたがるポリシーを一般化することは、強化学習において重要な課題となる。
本稿では、ペア化された値ターゲットの近接に基づいて、ソースドメインからの遷移を選択的に共有するバリューガイドデータフィルタリング(VGDF)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-28T04:08:40Z) - Diverse Policy Optimization for Structured Action Space [59.361076277997704]
エネルギーベースモデル(EBM)として構造化された行動空間における政策をモデル化するための多元的政策最適化(DPO)を提案する。
新しい強力な生成モデルであるGFlowNetは、効率よく多様なEMMベースのポリシーサンプリングとして導入されている。
ATSCとBattleベンチマークの実験では、DPOが驚くほど多様なポリシーを効率的に発見できることが示されている。
論文 参考訳(メタデータ) (2023-02-23T10:48:09Z) - Pervasive Machine Learning for Smart Radio Environments Enabled by
Reconfigurable Intelligent Surfaces [56.35676570414731]
Reconfigurable Intelligent Surfaces(RIS)の新たな技術は、スマート無線環境の実現手段として準備されている。
RISは、無線媒体上の電磁信号の伝搬を動的に制御するための、高度にスケーラブルで低コストで、ハードウェア効率が高く、ほぼエネルギーニュートラルなソリューションを提供する。
このような再構成可能な無線環境におけるRISの密配置に関する大きな課題の1つは、複数の準曲面の効率的な構成である。
論文 参考訳(メタデータ) (2022-05-08T06:21:33Z) - Realistic simulation of users for IT systems in cyber ranges [63.20765930558542]
ユーザアクティビティを生成するために,外部エージェントを用いて各マシンを計測する。
このエージェントは、決定論的および深層学習に基づく手法を組み合わせて、異なる環境に適応する。
また,会話や文書の作成を容易にする条件付きテキスト生成モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T10:53:29Z) - Deployment Optimization for Shared e-Mobility Systems with Multi-agent
Deep Neural Search [15.657420177295624]
共有e-mobilityサービスは世界中の都市で広くテストされ、試験運用されている。
本稿では,持続的な収益性を維持しつつ,ユーザに対してユビキタスなサービスを実現するための,空間的・時間的インフラストラクチャの展開と管理方法について検討する。
我々は,共有電子移動システムの主要動作詳細を粒度で抽象化した高忠実度シミュレーション環境を設計することで,この問題に対処する。
論文 参考訳(メタデータ) (2021-11-03T11:37:11Z) - Dual Behavior Regularized Reinforcement Learning [8.883885464358737]
強化学習は、環境とのインタラクションや経験の活用を通じて、様々な複雑なタスクを実行することが示されている。
本稿では,反実的後悔最小化に基づく二元的利点に基づく行動ポリシーを提案する。
論文 参考訳(メタデータ) (2021-09-19T00:47:18Z) - Fast Adaptation via Policy-Dynamics Value Functions [41.738462615120326]
本稿では,従来のトレーニングと異なる動的に迅速に適応するための新しいアプローチとして,ポリシ・ダイナミックス値関数(PD-VF)を紹介する。
PD-VFは、ポリシーと環境の空間における累積報酬を明示的に推定する。
提案手法は, MuJoCo ドメインの集合上で, 新たな動的処理に迅速に適応可能であることを示す。
論文 参考訳(メタデータ) (2020-07-06T16:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。