論文の概要: Environment-Aware Transfer Reinforcement Learning for Sustainable Beam Selection
- arxiv url: http://arxiv.org/abs/2511.11647v1
- Date: Mon, 10 Nov 2025 08:50:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:22.787108
- Title: Environment-Aware Transfer Reinforcement Learning for Sustainable Beam Selection
- Title(参考訳): 持続可能なビーム選択のための環境対応移動強化学習
- Authors: Dariush Salami, Ramin Hashemi, Parham Kazemi, Mikko A. Uusitalo,
- Abstract要約: 本稿では、転送学習と強化学習(RL)を用いて、5Gおよびネットワークを越えたビーム選択を改善するための新しい持続的アプローチを提案する。
本稿では,gNodeBs(gNBs)とその周辺散乱体の位置を表す点雲として環境をモデル化することを提案する。
点雲間のチャンファー距離を計算することにより、構造的に類似した環境を効率的に同定し、転送学習による事前学習モデルの再利用を可能にする。
- 参考スコア(独自算出の注目度): 3.2023814100005894
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel and sustainable approach for improving beam selection in 5G and beyond networks using transfer learning and Reinforcement Learning (RL). Traditional RL-based beam selection models require extensive training time and computational resources, particularly when deployed in diverse environments with varying propagation characteristics posing a major challenge for scalability and energy efficiency. To address this, we propose modeling the environment as a point cloud, where each point represents the locations of gNodeBs (gNBs) and surrounding scatterers. By computing the Chamfer distance between point clouds, structurally similar environments can be efficiently identified, enabling the reuse of pre-trained models through transfer learning. This methodology leads to a 16x reduction in training time and computational overhead, directly contributing to energy efficiency. By minimizing the need for retraining in each new deployment, our approach significantly lowers power consumption and supports the development of green and sustainable Artificial Intelligence (AI) in wireless systems. Furthermore, it accelerates time-to-deployment, reduces carbon emissions associated with training, and enhances the viability of deploying AI-driven communication systems at the edge. Simulation results confirm that our approach maintains high performance while drastically cutting energy costs, demonstrating the potential of transfer learning to enable scalable, adaptive, and environmentally conscious RL-based beam selection strategies in dynamic and diverse propagation environments.
- Abstract(参考訳): 本稿では,移動学習と強化学習(RL)を用いて,5Gおよびネットワークを越えたビーム選択を改善するための新しい,持続可能なアプローチを提案する。
従来のRLベースのビーム選択モデルでは、特に様々な伝搬特性を持つ多様な環境に展開する際に、広範囲なトレーニング時間と計算資源を必要とする。
そこで我々は,各点がgNodeBs(gNBs)とその周辺散乱体の位置を表す点雲として環境をモデル化することを提案する。
点雲間のチャンファー距離を計算することにより、構造的に類似した環境を効率的に同定し、転送学習による事前学習モデルの再利用を可能にする。
この手法はトレーニング時間と計算オーバーヘッドを16倍に削減し、エネルギー効率に直接貢献する。
新たな展開毎に再トレーニングの必要性を最小化することにより、電力消費を大幅に削減し、無線システムにおけるグリーンで持続可能な人工知能(AI)の開発を支援する。
さらに、タイム・トゥ・デプロイを加速し、トレーニングに関連する二酸化炭素排出量を削減し、AI駆動の通信システムをエッジに展開する可能性を高める。
シミュレーションの結果,提案手法はエネルギーコストを大幅に削減しながら高い性能を維持し,動的かつ多様な伝搬環境下で,スケーラブルで適応的で環境に配慮したRLベースのビーム選択戦略を実現するための伝達学習の可能性を示す。
関連論文リスト
- Optimizing Energy Management of Smart Grid using Reinforcement Learning aided by Surrogate models built using Physics-informed Neural Networks [29.49941497527361]
Reinforcement Learning (RL)は、スマートグリッドにおける最適電力フローの課題に対処するソリューションとして注目されている。
本稿では,Physics-informed Neural Networks (PINN) を用いて構築したサロゲートモデルを用いて,コストのかかるスマートグリッドシミュレータを置換することで,この問題に対処する。
論文 参考訳(メタデータ) (2025-10-20T10:17:42Z) - Energy-Efficient Learning-Based Beamforming for ISAC-Enabled V2X Networks [12.848904208580164]
本研究は、ISAC(Integrated Sentration and Communication)対応V2Xネットワークのための、エネルギー効率の高い学習ベースのビームフォーミング方式を提案する。
まず,V2X環境の動的・不確かさをマルコフ決定過程としてモデル化する。
そこで我々は,ビームフォーミングとパワーアロケーションを協調的に最適化する深層強化学習(DRL)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-08-27T04:52:07Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - Energy-Efficient Federated Edge Learning with Streaming Data: A Lyapunov Optimization Approach [34.00679567444125]
本研究では,長期エネルギー制約下でのデータ到着や資源の可利用性に固有のランダム性に対処する動的スケジューリングと資源割当アルゴリズムを開発した。
提案アルゴリズムは, デバイススケジューリング, 計算容量調整, 帯域幅の割り当ておよび各ラウンドの送信電力を適応的に決定する。
本手法の有効性をシミュレーションにより検証し,ベースライン方式と比較して学習性能とエネルギー効率が向上したことを示す。
論文 参考訳(メタデータ) (2024-05-20T14:13:22Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.08287089554127]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。