Fugu-MT 論文翻訳(概要): Reinforcement Learning with Reward Machines for Sleep Control in Mobile Networks

論文の概要: Reinforcement Learning with Reward Machines for Sleep Control in Mobile Networks

arxiv url: http://arxiv.org/abs/2604.07411v1
Date: Wed, 08 Apr 2026 12:17:43 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-10 18:34:05.457341
Title: Reinforcement Learning with Reward Machines for Sleep Control in Mobile Networks
Title（参考訳）: モバイルネットワークにおける睡眠制御のためのリワードマシンによる強化学習
Authors: Kristina Levina, Nikolaos Pappas, Athanasios Karapantelakis, Aneta Vulgarakis Feljan, Jendrik Seipp,
Abstract要約: モバイルネットワークにおけるエネルギー効率は、持続可能な通信インフラにとって不可欠である。報奨機を用いた強化学習を用いて、即時省エネと長期的影響のバランスをとる睡眠制御決定を行う。我々のフレームワークは、次世代モバイルネットワークのエネルギー管理に原則的かつスケーラブルなアプローチを提供する。
参考スコア（独自算出の注目度）: 6.644469604216879
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Energy efficiency in mobile networks is crucial for sustainable telecommunications infrastructure, particularly as network densification continues to increase power consumption. Sleep mechanisms for the components in mobile networks can reduce energy use, but deciding which components to put to sleep, when, and for how long while preserving quality of service (QoS) remains a difficult optimisation problem. In this paper, we utilise reinforcement learning with reward machines (RMs) to make sleep-control decisions that balance immediate energy savings and long-term QoS impact, i.e. time-averaged packet drop rates for deadline-constrained traffic and time-averaged minimum-throughput guarantees for constant-rate users. A challenge is that time-averaged constraints depend on cumulative performance over time rather than immediate performance. As a result, the effective reward is non-Markovian, and optimal actions depend on operational history rather than the instantaneous system state. RMs account for the history dependence by maintaining an abstract state that explicitly tracks the QoS constraint violations over time. Our framework provides a principled, scalable approach to energy management for next-generation mobile networks under diverse traffic patterns and QoS requirements.
Abstract（参考訳）: モバイルネットワークのエネルギー効率は、特にネットワークの密度化が電力消費を増加させているため、持続可能な通信インフラにとって不可欠である。モバイルネットワークにおけるコンポーネントの睡眠メカニズムは、エネルギー消費を減らすことができるが、サービス品質(QoS)を保ちながら、いつ、いつ、どのくらいの間、どのコンポーネントを眠らせるかを決定することは、難しい最適化問題である。本稿では,Regress Learning with reward Machine (RMs) を用いて,リアルタイム省エネと長期QoS影響のバランスをとる睡眠制御決定を行う。課題は、時間平均的な制約は、即時のパフォーマンスではなく、時間とともに累積的なパフォーマンスに依存することです。その結果、有効報酬は非マルコフ的であり、最適な行動は瞬間的なシステム状態よりも運用履歴に依存する。 RMは、QoS制約違反を時間とともに明示的に追跡する抽象状態を維持することによって、履歴依存を考慮に入れている。我々のフレームワークは、多様なトラフィックパターンとQoS要件の下で、次世代モバイルネットワークのエネルギー管理に原則的かつスケーラブルなアプローチを提供する。

関連論文リスト

Deep Reinforcement Learning-driven Edge Offloading for Latency-constrained XR pipelines [0.0]
没入型拡張現実(XR)アプリケーションは、リアルタイムの応答性を厳格に満たさなければならないレイテンシクリティカルなワークロードを導入します。適応実行と計算オフロードに対する既存のアプローチは、リアルタイムレイテンシ要求とデバイスバッテリ寿命の間の持続的な相互作用を完全に捉えていない。本稿では,エッジ支援型XRシステムに対して,実行場所,ワークロード品質,レイテンシ要件,バッテリダイナミクスを共同で検討した,バッテリ対応型実行管理フレームワークを提案する。
論文参考訳（メタデータ） (2026-03-17T17:30:11Z)
Enhanced Evolutionary Multi-Objective Deep Reinforcement Learning for Reliable and Efficient Wireless Rechargeable Sensor Networks [44.91945854166524]
ワイヤレス充電式センサネットワーク(WRSN)とモバイル充電機能は、ネットワーク寿命を延ばすための有望なソリューションを提供する。 WRSNは、ノード生存率の最大化と充電エネルギー効率の最大化の間の本質的にのトレードオフから、重要な課題に直面している。
論文参考訳（メタデータ） (2025-10-24T03:30:00Z)
CHOMET: Conditional Handovers via Meta-Learning [55.08287089554127]
ハンドオーバ(HO)は、多数の多様なモバイルユーザーとのシームレスな接続を可能にする、現代の携帯電話ネットワークの基盤である。モバイルネットワークがより多様なユーザや小さなセルと複雑化するにつれ、従来のHOは遅延の延長や障害の増加といった重大な課題に直面している。本稿では,CHO最適化にメタラーニングを利用するO-RANパラダイムに沿った新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-10T09:35:43Z)
Energy-Aware Dynamic Neural Inference [39.04688735618206]
エネルギーハーベスターと有限容量エネルギーストレージを備えたオンデバイス適応型推論システムを提案する。環境エネルギーの速度が増加するにつれて、エネルギー・信頼性を考慮した制御方式は精度を約5%向上させることが示されている。我々は、信頼性を意識し、認識できないコントローラを理論的に保証する原則的なポリシーを導出する。
論文参考訳（メタデータ） (2024-11-04T16:51:22Z)
Multiagent Reinforcement Learning with an Attention Mechanism for Improving Energy Efficiency in LoRa Networks [52.96907334080273]
ネットワーク規模が大きくなるにつれて、パケット衝突によるLoRaネットワークのエネルギー効率は急激に低下する。マルチエージェント強化学習(MALoRa)に基づく伝送パラメータ割り当てアルゴリズムを提案する。シミュレーションの結果,MALoRaはベースラインアルゴリズムと比較してシステムEEを著しく改善することがわかった。
論文参考訳（メタデータ） (2023-09-16T11:37:23Z)
Distributed Energy Management and Demand Response in Smart Grids: A Multi-Agent Deep Reinforcement Learning Framework [53.97223237572147]
本稿では、自律制御と再生可能エネルギー資源のスマート電力グリッドシステムへの統合のための多エージェント深層強化学習(DRL)フレームワークを提案する。特に,提案フレームワークは,住宅利用者に対する需要応答 (DR) と分散エネルギー管理 (DEM) を共同で検討している。
論文参考訳（メタデータ） (2022-11-29T01:18:58Z)
Deep Reinforcement Learning Based Multidimensional Resource Management for Energy Harvesting Cognitive NOMA Communications [64.1076645382049]
エネルギー収穫(EH)、認知無線(CR)、非直交多重アクセス(NOMA)の組み合わせはエネルギー効率を向上させるための有望な解決策である。本稿では,決定論的CR-NOMA IoTシステムにおけるスペクトル,エネルギー,時間資源管理について検討する。
論文参考訳（メタデータ） (2021-09-17T08:55:48Z)
Reinforcement Learning based Per-antenna Discrete Power Control for Massive MIMO Systems [44.27332693894973]
我々は,マルチユーザシステムの長期エネルギー効率を最大化するために,有限個の電力レベルを持つアンテナ単位の電力割り当てを検討する。シミュレーションの結果は、SINR閾値を達成しつつ、消費電力の最小化に成功したことを示すものである。
論文参考訳（メタデータ） (2021-01-28T18:03:51Z)
Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文参考訳（メタデータ） (2020-02-21T02:14:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。