論文の概要: Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks
- arxiv url: http://arxiv.org/abs/2606.16331v1
- Date: Mon, 15 Jun 2026 07:34:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.150839
- Title: Diffusion Offline Reinforcement Learning for Fair and Energy-Efficient UAV-Assisted Wireless Networks
- Title(参考訳): 公平かつエネルギー効率の良いUAV支援無線ネットワークのための拡散オフライン強化学習
- Authors: Eslam Eldeeb, Hirley Alves,
- Abstract要約: オフライン強化学習(RL)を利用した拡散ソフトアクター批判(拡散-SAC)手法を提案する。
Diffusion-SACは通常のオフラインRLベースラインよりも優れており、限られたデータセットでもより安定した収束と高い報酬を達成する。
この方法はデータ効率を向上し、エネルギー消費を低減し、既存のアルゴリズムと比較してスループットを35%以上向上させる。
- 参考スコア(独自算出の注目度): 4.225452248917631
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of generative artificial intelligence with wireless communication and signal processing systems has opened new avenues for intelligent, data-driven decision-making in future 6G networks. This work proposes a diffusion soft actor-critic (Diffusion-SAC) approach that leverages offline reinforcement learning (RL) enhanced by denoising diffusion probabilistic models (DDPMs) to optimize trajectory and scheduling control in unmanned aerial vehicle (UAV) networks. While offline RL methods, such as conservative Q-learning (CQL), can learn from static datasets, they often struggle to generalize in low-data or dynamic conditions. To address this, we combine the robustness of CQL with the generative power of diffusion models, enabling expressive and signal-aware policy learning that generalizes beyond behavior policies. Applied to a UAV-assisted wireless network, the proposed framework minimizes transmission energy and improves fairness among devices. Simulations show that Diffusion-SAC outperforms standard offline RL baselines, achieving more stable convergence and higher rewards even with limited datasets. The method enhances data efficiency, reduces energy consumption, and increases throughput by more than 35 % compared to existing algorithms, demonstrating its potential for robust policy learning in next-generation wireless control systems.
- Abstract(参考訳): 生成人工知能と無線通信と信号処理システムの統合により、将来の6Gネットワークにおいて、インテリジェントでデータ駆動型意思決定のための新たな道が開かれた。
本研究は,拡散確率モデル(DDPM)によって強化されたオフライン強化学習(RL)を活用して,無人航空機(UAV)ネットワークにおける軌道とスケジューリング制御を最適化する拡散ソフトアクタ・クリティカル(Diffusion-SAC)アプローチを提案する。
保守的なQ-ラーニング(CQL)のようなオフラインのRLメソッドは静的なデータセットから学習できるが、低データや動的条件での一般化に苦慮することが多い。
これを解決するために、我々はCQLの堅牢性と拡散モデルの生成力を組み合わせることで、行動ポリシーを超えて一般化する表現的および信号認識ポリシー学習を可能にします。
UAV支援無線ネットワークに適用し,送信エネルギーを最小化し,デバイス間の公平性を向上する。
シミュレーションにより、Diffusion-SACは標準のオフラインRLベースラインよりも優れ、限られたデータセットであってもより安定した収束とより高い報酬を達成することが示された。
この方法はデータ効率を向上し、エネルギー消費を低減し、既存のアルゴリズムと比較してスループットを35%以上向上させ、次世代無線制御システムにおけるロバストなポリシー学習の可能性を示す。
関連論文リスト
- Digital Twin-Assisted Adaptive Multi-Agent DRL for Intelligent Spectrum and Resource Management in Open-RAN UAV-Enabled 6G Networks [49.19977685617281]
6G無線ネットワークは、無人航空機(UAV)がカバー範囲を広げ、レジリエンスを向上し、地上ユーザのデプロイメントに信頼性の高い接続性を確保する上で重要な役割を果たす、シームレスにインテリジェントでオープンなRAN対応アーキテクチャを想定している。
高度にダイナミックなUAV支援環境でのスペクトルと資源の効率的な管理は、非線形システム相互作用、モビリティによって引き起こされるトポロジの変動、厳密なレイテンシとエネルギー制約により、依然として大きな課題である。
本稿では,デジタルツイン(DT)を利用した適応型深層強化学習(DRL)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-31T16:19:28Z) - xApp Empowered Resource Management for Non-Terrestrial Users in 5G O-RAN Networks [0.0]
本稿では,オープン無線アクセスネットワーク(O-RAN)のためのアクティブ無人航空機(UAV)モビリティ管理xAppを紹介する。
提案フレームワークはネットワーク条件を予測し、予測最適化により停止確率とハンドオーバ頻度を最小化する。
論文 参考訳(メタデータ) (2026-05-11T15:18:23Z) - Selecting Offline Reinforcement Learning Algorithms for Stochastic Network Control [2.3220521366735247]
オフラインRLは次世代無線ネットワークにとって有望なアプローチである。
保守的なQ-Learningは、異なる情報源にわたるより堅牢なポリシーを一貫して生み出すことを示す。
これらの結果は、AI駆動のネットワーク制御パイプラインにおけるオフラインRLアルゴリズム選択のための実用的なガイダンスを提供する。
論文 参考訳(メタデータ) (2026-03-04T10:41:10Z) - Large Language Model (LLM)-enabled Reinforcement Learning for Wireless Network Optimization [79.27012080083603]
大型言語モデル(LLM)は、無線ネットワークにおける強化学習を強化するための有望なツールを提供する。
マルチエージェント強化学習フレームワークを強化するために,LLM支援状態表現と意味抽出を提案する。
論文 参考訳(メタデータ) (2026-01-15T01:42:39Z) - Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.84636717632206]
空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。
有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。
LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文 参考訳(メタデータ) (2025-09-17T13:05:08Z) - From Pixels to CSI: Distilling Latent Dynamics For Efficient Wireless Resource Management [31.080933663717257]
本稿では,制御システムのダイナミクスを協調的にモデル化し,予測する新しい機械学習手法を提案する。
提案手法は,ベースライン方式に匹敵する制御性能を維持しつつ,送信電力を50%以上削減することを示す。
論文 参考訳(メタデータ) (2025-06-19T11:08:20Z) - Offline and Distributional Reinforcement Learning for Wireless Communications [5.771885923067511]
従来のオンライン強化学習(RL)とディープRL手法は、リアルタイム無線ネットワークにおいて制限に直面している。
これらの課題を克服できる2つの高度なRL技術である、オフラインおよび分散RLに焦点を当てる。
本稿では,無線通信アプリケーションのためのオフラインと分散RLを組み合わせた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-04T09:24:39Z) - Resilient UAV Trajectory Planning via Few-Shot Meta-Offline Reinforcement Learning [5.771885923067511]
本研究は、オフラインRLとモデルに依存しないメタ学習を組み合わせた、新しい、レジリエントで、少数ショットのメタオフラインRLアルゴリズムを提案する。
提案する数ショットメタオフラインRLアルゴリズムは,ベースライン方式よりも高速に収束することを示す。
オフラインデータセットを使用して最適な共同AoIと送信パワーを達成できる唯一のアルゴリズムである。
論文 参考訳(メタデータ) (2025-02-03T11:39:12Z) - DRL Optimization Trajectory Generation via Wireless Network Intent-Guided Diffusion Models for Optimizing Resource Allocation [58.62766376631344]
本稿では、無線通信ネットワークの異なる状態変化に対応するために、カスタマイズされた無線ネットワークインテント(WNI-G)モデルを提案する。
大規模シミュレーションにより、動的通信システムにおけるスペクトル効率と従来のDRLモデルの変動の安定性が向上する。
論文 参考訳(メタデータ) (2024-10-18T14:04:38Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。