Fugu-MT 論文翻訳(概要): Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless Networks

論文の概要: Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless Networks

arxiv url: http://arxiv.org/abs/2207.06131v1
Date: Wed, 13 Jul 2022 11:28:02 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-14 15:27:19.595669
Title: Continual Meta-Reinforcement Learning for UAV-Aided Vehicular Wireless Networks
Title（参考訳）: UAV支援Vehicular Wireless Networkの連続的メタ強化学習
Authors: Riccardo Marini, Sangwoo Park, Osvaldo Simeone, Chiara Buratti
Abstract要約: 無人航空基地局(UABS)は、V2Xサービスによる拡張センシングなどのアプリケーションをサポートするために、車載無線ネットワークに配備することができる。このようなシステムの鍵となる問題は、UABSの軌道を効率的に最適化し、カバー範囲を最大化するアルゴリズムを設計することである。本稿では,以前に経験した交通構成から新しい条件へ情報を伝達する手段として,連続メタRLを提案する。
参考スコア（独自算出の注目度）: 29.89196067653312
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Unmanned aerial base stations (UABSs) can be deployed in vehicular wireless networks to support applications such as extended sensing via vehicle-to-everything (V2X) services. A key problem in such systems is designing algorithms that can efficiently optimize the trajectory of the UABS in order to maximize coverage. In existing solutions, such optimization is carried out from scratch for any new traffic configuration, often by means of conventional reinforcement learning (RL). In this paper, we propose the use of continual meta-RL as a means to transfer information from previously experienced traffic configurations to new conditions, with the goal of reducing the time needed to optimize the UABS's policy. Adopting the Continual Meta Policy Search (CoMPS) strategy, we demonstrate significant efficiency gains as compared to conventional RL, as well as to naive transfer learning methods.
Abstract（参考訳）: 無人航空基地局(UABS)は、V2Xサービスによる拡張センシングなどのアプリケーションをサポートするために、車載無線ネットワークに配備することができる。このようなシステムの鍵となる問題は、UABSの軌道を効率的に最適化してカバレッジを最大化するアルゴリズムを設計することである。既存のソリューションでは、従来の強化学習(RL)を用いて、新しいトラフィック構成をスクラッチから行うことが多い。本稿では,UABSのポリシーを最適化するために必要な時間を短縮することを目的として,従来経験した交通構成から新しい条件へ情報を伝達する手段として,連続メタRLを提案する。継続的メタポリシーサーチ(CoMPS)戦略を採用することで,従来のRLに比べて大きな効率向上を示すとともに,伝達学習手法も提案する。

関連論文リスト

Large Language Model (LLM)-enabled Reinforcement Learning for Wireless Network Optimization [79.27012080083603]
大型言語モデル(LLM)は、無線ネットワークにおける強化学習を強化するための有望なツールを提供する。マルチエージェント強化学習フレームワークを強化するために,LLM支援状態表現と意味抽出を提案する。
論文参考訳（メタデータ） (2026-01-15T01:42:39Z)
Optimizing UAV Aerial Base Station Flights Using DRL-based Proximal Policy Optimization [3.1376814250061544]
無人航空機(UAV)ベースの基地局は、最先端ネットワークの迅速な展開が救命可能性の最大化に不可欠である緊急時に、有望な解決策を提供する。本稿では,UAVが環境と対話し,最適構成を決定するための自動強化学習手法を提案する。
論文参考訳（メタデータ） (2025-04-04T22:06:01Z)
Age and Power Minimization via Meta-Deep Reinforcement Learning in UAV Networks [42.14963369042011]
本研究では,データ収集を行う無人航空機(UAV)が支援するモノのインターネット(IoT)ネットワークについて検討する。我々の目的は、様々なAoIと送信電力の組み合わせを最小限に抑えるために、UAV飛行軌道とスケジューリングポリシーを最適化することである。
論文参考訳（メタデータ） (2025-01-24T16:17:53Z)
Model Partition and Resource Allocation for Split Learning in Vehicular Edge Networks [24.85135243655983]
本稿では,これらの課題に対処する新しいU字型分割学習(U-SFL)フレームワークを提案する。 U-SFLは、生のデータとラベルの両方をVU側に置くことで、プライバシー保護を強化することができる。通信効率を最適化するために,送信データの次元を著しく低減する意味認識型自動エンコーダ(SAE)を導入する。
論文参考訳（メタデータ） (2024-11-11T07:59:13Z)
Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文参考訳（メタデータ） (2024-09-27T13:05:02Z)
UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文参考訳（メタデータ） (2024-04-11T03:19:22Z)
A Hybrid Framework of Reinforcement Learning and Convex Optimization for UAV-Based Autonomous Metaverse Data Collection [16.731929552692524]
本稿では,UAVが基地局(BS)のカバー範囲を広げて道路側ユニット(RSU)で生成したメタバースデータを収集する,UAV支援型メタバースネットワークについて考察する。データ収集効率を改善するため、リソース割り当てとトラジェクトリ制御をシステムモデルに統合する。提案するUAV支援Metaverseネットワークシステムモデルに基づいて,時間系列最適化問題を協調的に解くために,強化学習と凸最適化を備えたハイブリッドフレームワークを設計する。
論文参考訳（メタデータ） (2023-05-29T11:49:20Z)
Muti-Agent Proximal Policy Optimization For Data Freshness in UAV-assisted Networks [4.042622147977782]
収集したデータが時間に敏感な場合に注目し,そのタイムラインを維持することが重要である。我々の目標は、UAVの軌道を最適に設計することであり、グローバル・エイジ・オブ・アップデート(AoU)のような訪問するIoTデバイスのサブセットを最小化することである。
論文参考訳（メタデータ） (2023-03-15T15:03:09Z)
Traffic Management of Autonomous Vehicles using Policy Based Deep Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文参考訳（メタデータ） (2022-06-28T02:46:20Z)
Offline Contextual Bandits for Wireless Network Optimization [107.24086150482843]
本稿では,ユーザ要求の変化に応じて,ネットワーク内の各セルの構成パラメータを自動的に調整するポリシの学習方法について検討する。私たちのソリューションは、オフライン学習のための既存の方法を組み合わせて、この文脈で生じる重要な課題を克服する原則的な方法でそれらを適応します。
論文参考訳（メタデータ） (2021-11-11T11:31:20Z)
Transferable Deep Reinforcement Learning Framework for Autonomous Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文参考訳（メタデータ） (2021-05-28T08:45:37Z)
Traffic Flow Estimation using LTE Radio Frequency Counters and Machine Learning [0.0]
本稿では,LTE/4G無線周波数性能測定カウンタを用いた新しいトラフィックフロー推定手法を提案する。我々のアプローチは、時間だけでなく空間においてもソリューションを一般化するためにトランスファーラーニングを適用することの利点が示される。
論文参考訳（メタデータ） (2021-01-22T15:05:10Z)
Meta-Reinforcement Learning for Trajectory Design in Wireless UAV Networks [151.65541208130995]
ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-05-25T20:43:59Z)
Data Freshness and Energy-Efficient UAV Navigation Optimization: A Deep Reinforcement Learning Approach [88.45509934702913]
我々は、移動基地局(BS)が配備される複数の無人航空機(UAV)のナビゲーションポリシーを設計する。我々は、地上BSにおけるデータの鮮度を確保するために、エネルギーや情報年齢(AoI)の制約などの異なる文脈情報を組み込んだ。提案したトレーニングモデルを適用することで、UAV-BSに対する効果的なリアルタイム軌道ポリシーは、時間とともに観測可能なネットワーク状態をキャプチャする。
論文参考訳（メタデータ） (2020-02-21T07:29:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。