論文の概要: A Multi-Agent DRL-Based Framework for Optimal Resource Allocation and Twin Migration in the Multi-Tier Vehicular Metaverse
- arxiv url: http://arxiv.org/abs/2502.19004v1
- Date: Wed, 26 Feb 2025 10:09:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-27 14:56:25.301469
- Title: A Multi-Agent DRL-Based Framework for Optimal Resource Allocation and Twin Migration in the Multi-Tier Vehicular Metaverse
- Title(参考訳): 最適資源配分と双極子移動のためのマルチエージェントDRLベースフレームワーク
- Authors: Nahom Abishu Hayla, A. Mohammed Seid, Aiman Erbad, Tilahun M. Getu, Ala Al-Fuqaha, Mohsen Guizani,
- Abstract要約: 多層車両メタバースは、車両を相互接続されたデジタルエコシステム内の必須ノードに変えることを約束する。
階層的なStackelbergゲームベースのインセンティブ機構であるGraph Convolutional Networks(GCNs)とマルチエージェント深層強化学習(MADRL)を統合した,新たなマルチ層リソースアロケーションとVTマイグレーションフレームワークを導入する。
この動的で多層的な車種メタバースをマルコフ決定過程(MDP)としてモデル化することにより、多目的多元決定性ポリシー勾配(MO-MADDPG)と呼ばれるMADRLベースのアルゴリズムを開発する。
- 参考スコア(独自算出の注目度): 30.745598330516167
- License:
- Abstract: Although multi-tier vehicular Metaverse promises to transform vehicles into essential nodes -- within an interconnected digital ecosystem -- using efficient resource allocation and seamless vehicular twin (VT) migration, this can hardly be achieved by the existing techniques operating in a highly dynamic vehicular environment, since they can hardly balance multi-objective optimization problems such as latency reduction, resource utilization, and user experience (UX). To address these challenges, we introduce a novel multi-tier resource allocation and VT migration framework that integrates Graph Convolutional Networks (GCNs), a hierarchical Stackelberg game-based incentive mechanism, and Multi-Agent Deep Reinforcement Learning (MADRL). The GCN-based model captures both spatial and temporal dependencies within the vehicular network; the Stackelberg game-based incentive mechanism fosters cooperation between vehicles and infrastructure; and the MADRL algorithm jointly optimizes resource allocation and VT migration in real time. By modeling this dynamic and multi-tier vehicular Metaverse as a Markov Decision Process (MDP), we develop a MADRL-based algorithm dubbed the Multi-Objective Multi-Agent Deep Deterministic Policy Gradient (MO-MADDPG), which can effectively balances the various conflicting objectives. Extensive simulations validate the effectiveness of this algorithm that is demonstrated to enhance scalability, reliability, and efficiency while considerably improving latency, resource utilization, migration cost, and overall UX by 12.8%, 9.7%, 14.2%, and 16.1%, respectively.
- Abstract(参考訳): 多層車種Metaverseは、効率的なリソース割り当てとシームレスな二輪車(VT)マイグレーションを使用して、相互接続されたデジタルエコシステム内で、車両を必須ノードに変換することを約束するが、遅延低減やリソース利用、ユーザエクスペリエンス(UX)といった、多目的最適化の問題とのバランスがほとんどないため、非常にダイナミックな車種環境で運用されている既存の技術では実現できない。
これらの課題に対処するために,階層的なStackelbergゲームベースのインセンティブ機構であるGraph Convolutional Networks(GCNs)とマルチエージェント深層強化学習(MADRL)を統合した,新しいマルチ層リソースアロケーションとVTマイグレーションフレームワークを導入する。
GCNベースのモデルは、車両ネットワーク内の空間的および時間的依存関係をキャプチャし、Stackelbergゲームベースのインセンティブメカニズムは車両とインフラ間の協調を促進する。
この動的で多層的な車種メタバースをマルコフ決定過程 (MDP) としてモデル化することにより,多目的多元深層決定性ポリシー勾配 (MO-MADDPG) と呼ばれるMADRLに基づくアルゴリズムを開発し,様々な相反する目的を効果的にバランスさせる。
大規模なシミュレーションにより、スケーラビリティ、信頼性、効率を向上させるとともに、レイテンシ、リソース利用、マイグレーションコスト、全体的なUXを12.8%、9.7%、14.2%、16.1%改善することが示されている。
関連論文リスト
- HEART: Achieving Timely Multi-Model Training for Vehicle-Edge-Cloud-Integrated Hierarchical Federated Learning [30.75025062952915]
AI対応のIoT of Vehicles(IoV)の急速な成長は、効率的な機械学習(ML)ソリューションを求めている。
車両はしばしば複数のMLタスクを同時に実行する必要がある。
本稿では,グローバルトレーニング遅延の最小化を目的とした動的VEC-HFLにおけるマルチモデルトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-17T03:15:03Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Multiobjective Vehicle Routing Optimization with Time Windows: A Hybrid Approach Using Deep Reinforcement Learning and NSGA-II [52.083337333478674]
本稿では、時間窓を用いた多目的車両ルーティング問題(MOVRPTW)に対処するために、ウェイト・アウェア・ディープ・強化学習(WADRL)手法を提案する。
WADRLの結果を最適化するために非支配的ソート遺伝的アルゴリズム-II (NSGA-II) 法を用いる。
論文 参考訳(メタデータ) (2024-07-18T02:46:06Z) - Hybrid-Generative Diffusion Models for Attack-Oriented Twin Migration in Vehicular Metaverses [58.264499654343226]
Vehicle Twins (VTs) は、Vehicular Metaverse Users (VMUs) 向けに没入型仮想サービスを提供するデジタルツインである。
車両の高モビリティ、エッジサーバの不均一なデプロイ、潜在的なセキュリティ脅威は、効率的で信頼性の高いVTマイグレーションを実現する上での課題である。
車両メタバースにおけるセキュアで信頼性の高いVTマイグレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-05T11:11:33Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Multi-attribute Auction-based Resource Allocation for Twins Migration in Vehicular Metaverses: A GPT-based DRL Approach [85.65587846913793]
車両メタバース(Vehicular Metaverses)は、近代自動車産業を強化するために開発され、コネクテッドカー間の没入的で安全な体験を提供する。
本稿では,VTsマイグレーション時の資源配分を最適化する属性対応オークション方式を提案する。
我々は、生成事前学習型変換器(GPT)に基づく深部強化学習(DRL)アルゴリズムを用いて、DDAオークション器を訓練し、オークションクロックを効率的に調整する。
論文 参考訳(メタデータ) (2024-06-08T09:41:38Z) - Hierarchical Multi-Agent DRL-Based Framework for Joint Multi-RAT
Assignment and Dynamic Resource Allocation in Next-Generation HetNets [21.637440368520487]
本稿では,次世代無線ネットワーク(HetNets)における共同最適無線アクセス技術(RATs)の割り当てと電力割り当てによるコストアウェアダウンリンク総和率の問題について考察する。
本稿では,DeepRAT(DeepRAT)と呼ばれる階層型多エージェント深層強化学習(DRL)フレームワークを提案する。
特に、DeepRATフレームワークは、問題を2つの主要なステージに分解する: 単一エージェントのDeep Q Networkアルゴリズムを実装するRATs-EDs割り当てステージと、マルチエージェントのDeep Deterministic Policy Gradientを利用するパワー割り当てステージである。
論文 参考訳(メタデータ) (2022-02-28T09:49:44Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Resource allocation in dynamic multiagent systems [0.0]
MG-RAOアルゴリズムは,マルチエージェントシステムにおける資源配分問題を解決するために開発された。
シミュレーション環境における固定リソース割り当てに対する23~28%の改善を示す。
また、揮発性システムでは、mg-raoアルゴリズムを用いて、子エージェントがすべてのエージェントのリソース割り当てをモデル化するように構成されているため、複数のエージェント群をモデル化するときのパフォーマンスは46.5%である。
論文 参考訳(メタデータ) (2021-02-16T17:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。