論文の概要: Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless
Networks
- arxiv url: http://arxiv.org/abs/2207.06131v1
- Date: Wed, 13 Jul 2022 11:28:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 15:27:19.595669
- Title: Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless
Networks
- Title(参考訳): UAV支援Vehicular Wireless Networkの連続的メタ強化学習
- Authors: Riccardo Marini, Sangwoo Park, Osvaldo Simeone, Chiara Buratti
- Abstract要約: 無人航空基地局(UABS)は、V2Xサービスによる拡張センシングなどのアプリケーションをサポートするために、車載無線ネットワークに配備することができる。
このようなシステムの鍵となる問題は、UABSの軌道を効率的に最適化し、カバー範囲を最大化するアルゴリズムを設計することである。
本稿では,以前に経験した交通構成から新しい条件へ情報を伝達する手段として,連続メタRLを提案する。
- 参考スコア(独自算出の注目度): 29.89196067653312
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unmanned aerial base stations (UABSs) can be deployed in vehicular wireless
networks to support applications such as extended sensing via
vehicle-to-everything (V2X) services. A key problem in such systems is
designing algorithms that can efficiently optimize the trajectory of the UABS
in order to maximize coverage. In existing solutions, such optimization is
carried out from scratch for any new traffic configuration, often by means of
conventional reinforcement learning (RL). In this paper, we propose the use of
continual meta-RL as a means to transfer information from previously
experienced traffic configurations to new conditions, with the goal of reducing
the time needed to optimize the UABS's policy. Adopting the Continual Meta
Policy Search (CoMPS) strategy, we demonstrate significant efficiency gains as
compared to conventional RL, as well as to naive transfer learning methods.
- Abstract(参考訳): 無人航空基地局(UABS)は、V2Xサービスによる拡張センシングなどのアプリケーションをサポートするために、車載無線ネットワークに配備することができる。
このようなシステムの鍵となる問題は、UABSの軌道を効率的に最適化してカバレッジを最大化するアルゴリズムを設計することである。
既存のソリューションでは、従来の強化学習(RL)を用いて、新しいトラフィック構成をスクラッチから行うことが多い。
本稿では,UABSのポリシーを最適化するために必要な時間を短縮することを目的として,従来経験した交通構成から新しい条件へ情報を伝達する手段として,連続メタRLを提案する。
継続的メタポリシーサーチ(CoMPS)戦略を採用することで,従来のRLに比べて大きな効率向上を示すとともに,伝達学習手法も提案する。
関連論文リスト
- Traffic Learning and Proactive UAV Trajectory Planning for Data Uplink
in Markovian IoT Models [6.49537221266081]
IoTネットワークでは、従来のリソース管理スキームはデバイスと基地局の間のメッセージ交換に依存している。
マルコフイベントに基づくIoTデバイスのトラフィック到着を推定する,新たな学習ベースのフレームワークを提案する。
本稿では,各UAVの最適方針を最適化する深層強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-24T21:57:55Z) - A Hybrid Framework of Reinforcement Learning and Convex Optimization for
UAV-Based Autonomous Metaverse Data Collection [16.731929552692524]
本稿では,UAVが基地局(BS)のカバー範囲を広げて道路側ユニット(RSU)で生成したメタバースデータを収集する,UAV支援型メタバースネットワークについて考察する。
データ収集効率を改善するため、リソース割り当てとトラジェクトリ制御をシステムモデルに統合する。
提案するUAV支援Metaverseネットワークシステムモデルに基づいて,時間系列最適化問題を協調的に解くために,強化学習と凸最適化を備えたハイブリッドフレームワークを設計する。
論文 参考訳(メタデータ) (2023-05-29T11:49:20Z) - Muti-Agent Proximal Policy Optimization For Data Freshness in
UAV-assisted Networks [4.042622147977782]
収集したデータが時間に敏感な場合に注目し,そのタイムラインを維持することが重要である。
我々の目標は、UAVの軌道を最適に設計することであり、グローバル・エイジ・オブ・アップデート(AoU)のような訪問するIoTデバイスのサブセットを最小化することである。
論文 参考訳(メタデータ) (2023-03-15T15:03:09Z) - Traffic Management of Autonomous Vehicles using Policy Based Deep
Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。
交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文 参考訳(メタデータ) (2022-06-28T02:46:20Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Offline Contextual Bandits for Wireless Network Optimization [107.24086150482843]
本稿では,ユーザ要求の変化に応じて,ネットワーク内の各セルの構成パラメータを自動的に調整するポリシの学習方法について検討する。
私たちのソリューションは、オフライン学習のための既存の方法を組み合わせて、この文脈で生じる重要な課題を克服する原則的な方法でそれらを適応します。
論文 参考訳(メタデータ) (2021-11-11T11:31:20Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Traffic Flow Estimation using LTE Radio Frequency Counters and Machine
Learning [0.0]
本稿では,LTE/4G無線周波数性能測定カウンタを用いた新しいトラフィックフロー推定手法を提案する。
我々のアプローチは、時間だけでなく空間においてもソリューションを一般化するためにトランスファーラーニングを適用することの利点が示される。
論文 参考訳(メタデータ) (2021-01-22T15:05:10Z) - Distributed Multi-agent Meta Learning for Trajectory Design in Wireless
Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。
値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文 参考訳(メタデータ) (2020-12-06T01:30:12Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。