論文の概要: Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless
Networks
- arxiv url: http://arxiv.org/abs/2207.06131v1
- Date: Wed, 13 Jul 2022 11:28:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 15:27:19.595669
- Title: Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless
Networks
- Title(参考訳): UAV支援Vehicular Wireless Networkの連続的メタ強化学習
- Authors: Riccardo Marini, Sangwoo Park, Osvaldo Simeone, Chiara Buratti
- Abstract要約: 無人航空基地局(UABS)は、V2Xサービスによる拡張センシングなどのアプリケーションをサポートするために、車載無線ネットワークに配備することができる。
このようなシステムの鍵となる問題は、UABSの軌道を効率的に最適化し、カバー範囲を最大化するアルゴリズムを設計することである。
本稿では,以前に経験した交通構成から新しい条件へ情報を伝達する手段として,連続メタRLを提案する。
- 参考スコア(独自算出の注目度): 29.89196067653312
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Unmanned aerial base stations (UABSs) can be deployed in vehicular wireless
networks to support applications such as extended sensing via
vehicle-to-everything (V2X) services. A key problem in such systems is
designing algorithms that can efficiently optimize the trajectory of the UABS
in order to maximize coverage. In existing solutions, such optimization is
carried out from scratch for any new traffic configuration, often by means of
conventional reinforcement learning (RL). In this paper, we propose the use of
continual meta-RL as a means to transfer information from previously
experienced traffic configurations to new conditions, with the goal of reducing
the time needed to optimize the UABS's policy. Adopting the Continual Meta
Policy Search (CoMPS) strategy, we demonstrate significant efficiency gains as
compared to conventional RL, as well as to naive transfer learning methods.
- Abstract(参考訳): 無人航空基地局(UABS)は、V2Xサービスによる拡張センシングなどのアプリケーションをサポートするために、車載無線ネットワークに配備することができる。
このようなシステムの鍵となる問題は、UABSの軌道を効率的に最適化してカバレッジを最大化するアルゴリズムを設計することである。
既存のソリューションでは、従来の強化学習(RL)を用いて、新しいトラフィック構成をスクラッチから行うことが多い。
本稿では,UABSのポリシーを最適化するために必要な時間を短縮することを目的として,従来経験した交通構成から新しい条件へ情報を伝達する手段として,連続メタRLを提案する。
継続的メタポリシーサーチ(CoMPS)戦略を採用することで,従来のRLに比べて大きな効率向上を示すとともに,伝達学習手法も提案する。
関連論文リスト
- Model Partition and Resource Allocation for Split Learning in Vehicular Edge Networks [24.85135243655983]
本稿では,これらの課題に対処する新しいU字型分割学習(U-SFL)フレームワークを提案する。
U-SFLは、生のデータとラベルの両方をVU側に置くことで、プライバシー保護を強化することができる。
通信効率を最適化するために,送信データの次元を著しく低減する意味認識型自動エンコーダ(SAE)を導入する。
論文 参考訳(メタデータ) (2024-11-11T07:59:13Z) - Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。
手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。
提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文 参考訳(メタデータ) (2024-09-27T13:05:02Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - A Hybrid Framework of Reinforcement Learning and Convex Optimization for
UAV-Based Autonomous Metaverse Data Collection [16.731929552692524]
本稿では,UAVが基地局(BS)のカバー範囲を広げて道路側ユニット(RSU)で生成したメタバースデータを収集する,UAV支援型メタバースネットワークについて考察する。
データ収集効率を改善するため、リソース割り当てとトラジェクトリ制御をシステムモデルに統合する。
提案するUAV支援Metaverseネットワークシステムモデルに基づいて,時間系列最適化問題を協調的に解くために,強化学習と凸最適化を備えたハイブリッドフレームワークを設計する。
論文 参考訳(メタデータ) (2023-05-29T11:49:20Z) - Muti-Agent Proximal Policy Optimization For Data Freshness in
UAV-assisted Networks [4.042622147977782]
収集したデータが時間に敏感な場合に注目し,そのタイムラインを維持することが重要である。
我々の目標は、UAVの軌道を最適に設計することであり、グローバル・エイジ・オブ・アップデート(AoU)のような訪問するIoTデバイスのサブセットを最小化することである。
論文 参考訳(メタデータ) (2023-03-15T15:03:09Z) - Traffic Management of Autonomous Vehicles using Policy Based Deep
Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。
交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文 参考訳(メタデータ) (2022-06-28T02:46:20Z) - Offline Contextual Bandits for Wireless Network Optimization [107.24086150482843]
本稿では,ユーザ要求の変化に応じて,ネットワーク内の各セルの構成パラメータを自動的に調整するポリシの学習方法について検討する。
私たちのソリューションは、オフライン学習のための既存の方法を組み合わせて、この文脈で生じる重要な課題を克服する原則的な方法でそれらを適応します。
論文 参考訳(メタデータ) (2021-11-11T11:31:20Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Traffic Flow Estimation using LTE Radio Frequency Counters and Machine
Learning [0.0]
本稿では,LTE/4G無線周波数性能測定カウンタを用いた新しいトラフィックフロー推定手法を提案する。
我々のアプローチは、時間だけでなく空間においてもソリューションを一般化するためにトランスファーラーニングを適用することの利点が示される。
論文 参考訳(メタデータ) (2021-01-22T15:05:10Z) - Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-25T20:43:59Z) - Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep
Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。
我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。
提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文 参考訳(メタデータ) (2020-02-21T07:29:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。