論文の概要: Online Learning for Optimizing AoI-Energy Tradeoff under Unknown Channel Statistics
- arxiv url: http://arxiv.org/abs/2509.18654v1
- Date: Tue, 23 Sep 2025 05:15:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.7132
- Title: Online Learning for Optimizing AoI-Energy Tradeoff under Unknown Channel Statistics
- Title(参考訳): 未知チャネル統計に基づくAoIエネルギートレードオフ最適化のためのオンライン学習
- Authors: Mohamed A. Abd-Elmagid, Ming Shi, Eylem Ekici, Ness B. Shroff,
- Abstract要約: 我々は,ソースノード(エネルギー制限のある)が,目的地ノードにおける情報ステータスを可能な限り新鮮に保つことを目的としたリアルタイムモニタリングシステムについて検討する。
目的地ノードにおける情報の鮮度は、情報年代測定(AoI)によって測定される。
この設定では、ソースの送信コスト(または同等のエネルギー消費)と目的地での達成可能なAoI性能との間に自然なトレードオフが存在する。
- 参考スコア(独自算出の注目度): 29.444935744345727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider a real-time monitoring system where a source node (with energy limitations) aims to keep the information status at a destination node as fresh as possible by scheduling status update transmissions over a set of channels. The freshness of information at the destination node is measured in terms of the Age of Information (AoI) metric. In this setting, a natural tradeoff exists between the transmission cost (or equivalently, energy consumption) of the source and the achievable AoI performance at the destination. This tradeoff has been optimized in the existing literature under the assumption of having a complete knowledge of the channel statistics. In this work, we develop online learning-based algorithms with finite-time guarantees that optimize this tradeoff in the practical scenario where the channel statistics are unknown to the scheduler. In particular, when the channel statistics are known, the optimal scheduling policy is first proven to have a threshold-based structure with respect to the value of AoI (i.e., it is optimal to drop updates when the AoI value is below some threshold). This key insight was then utilized to develop the proposed learning algorithms that surprisingly achieve an order-optimal regret (i.e., $O(1)$) with respect to the time horizon length.
- Abstract(参考訳): 本研究では,送信元ノード(エネルギー制限のある)が通信先ノードの情報をできるだけ新しい状態に保つためのリアルタイムモニタリングシステムについて検討する。
目的地ノードにおける情報の鮮度は、情報年代測定(AoI)によって測定される。
この設定では、ソースの送信コスト(または同等のエネルギー消費)と目的地での達成可能なAoI性能との間に自然なトレードオフが存在する。
このトレードオフは、チャネル統計の完全な知識を前提として、既存の文献で最適化されている。
本研究では,スケジューラに対してチャネル統計が未知な現実的なシナリオにおいて,このトレードオフを最適化する有限時間保証付きオンライン学習ベースのアルゴリズムを開発する。
特に、チャネル統計が知られている場合、最適なスケジューリングポリシは、最初にAoIの値に対してしきい値に基づく構造を持つことが証明される(すなわち、AoI値がしきい値以下である場合に更新をドロップすることが最適である)。
この重要な洞察は、時間的地平線長に関して、オーダー最適後悔(すなわち$O(1)$)を驚くほど達成する、提案された学習アルゴリズムの開発に利用された。
関連論文リスト
- Pull-Based Query Scheduling for Goal-Oriented Semantic Communication [14.787190731074322]
本稿では、プルベースステータス更新システムにおけるゴール指向セマンティック通信のためのクエリスケジューリングについて述べる。
本稿では,有効度尺度(GoE)を導入し,長期的有効性分析に累積的視点理論(CPT)を統合する。
本稿では、動的プログラミングに基づくモデルベースソリューションと、最先端の深層強化学習(DRL)アルゴリズムを用いたモデルフリーソリューションを提案する。
論文 参考訳(メタデータ) (2025-03-09T18:51:14Z) - Age Optimal Sampling for Unreliable Channels under Unknown Channel Statistics [25.04993246830622]
本研究では,センサが受信機にステータスを転送するシステムについて検討し,受信機は信頼性の高いチャネルを介して送信結果をセンサに送信する。
受信機におけるステータス情報のタイムラインを評価するために、Age of Informationのメトリクスを用いる。
この問題を解決するためにRobins-Monroアルゴリズムを提案し、最適しきい値をほぼ確実に近似できることを実証する。
論文 参考訳(メタデータ) (2024-12-24T03:06:22Z) - On the Effective Usage of Priors in RSS-based Localization [56.68864078417909]
本稿では、受信信号強度(RSS)指紋と畳み込みニューラルネットワークに基づくアルゴリズムLocUNetを提案する。
本稿では,密集市街地における局所化問題について検討する。
まず,LocUNetがRx位置やRxの事前分布を学習し,トレーニングデータから送信者(Tx)アソシエーションの好みを学習し,その性能を評価できることを示す。
論文 参考訳(メタデータ) (2022-11-28T00:31:02Z) - Age of Semantics in Cooperative Communications: To Expedite Simulation
Towards Real via Offline Reinforcement Learning [53.18060442931179]
協調リレー通信システムにおける状態更新のセマンティックス更新度を測定するための意味学年代(AoS)を提案する。
オンライン・ディープ・アクター・クリティック(DAC)学習手法を,政治時間差学習の枠組みに基づいて提案する。
そこで我々は,以前に収集したデータセットから最適制御ポリシーを推定する,新しいオフラインDAC方式を提案する。
論文 参考訳(メタデータ) (2022-09-19T11:55:28Z) - Event-Triggered Time-Varying Bayesian Optimization [47.30677525394649]
本稿では,対象関数の変化を検出してデータセットをリセットするまで,最適化問題を静的に扱うイベントトリガーアルゴリズムET-GP-UCBを提案する。
これにより、アルゴリズムは正確な事前知識を必要とせずに、オンラインで時間変化を実現することができる。
時間的変化を正確に知ることなく、適応的リセットに対する後悔境界を導出し、ET-GP-UCBが合成データと実世界のデータの両方で競合するGP-UCBアルゴリズムより優れていることを示す数値実験を行った。
論文 参考訳(メタデータ) (2022-08-23T07:50:52Z) - Learning to Minimize Age of Information over an Unreliable Channel with
Energy Harvesting [1.3764085113103222]
新しいステータス更新を検知するエネルギーコストと、実用的なシステムをよりよく捉えるための送信エネルギーコストを考慮する。
未知環境の場合、システムパラメータとステータス更新ポリシーをリアルタイムで学習する平均コスト強化学習アルゴリズムが提案される。
論文 参考訳(メタデータ) (2021-06-30T13:05:37Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Better than the Best: Gradient-based Improper Reinforcement Learning for
Network Scheduling [60.48359567964899]
パケット遅延を最小限に抑えるため,制約付き待ち行列ネットワークにおけるスケジューリングの問題を考える。
我々は、利用可能な原子ポリシーよりも優れたスケジューラを生成するポリシー勾配に基づく強化学習アルゴリズムを使用する。
論文 参考訳(メタデータ) (2021-05-01T10:18:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。