論文の概要: Age Optimal Sampling for Unreliable Channels under Unknown Channel Statistics
- arxiv url: http://arxiv.org/abs/2412.18119v2
- Date: Mon, 24 Feb 2025 08:42:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 22:39:20.792307
- Title: Age Optimal Sampling for Unreliable Channels under Unknown Channel Statistics
- Title(参考訳): 未知チャネル統計に基づく信頼できないチャネルの年齢最適サンプリング
- Authors: Hongyi He, Haoyue Tang, Jiayu Pan, Jintao Wang, Jian Song, Leandros Tassiulas,
- Abstract要約: 本研究では,センサが受信機にステータスを転送するシステムについて検討し,受信機は信頼性の高いチャネルを介して送信結果をセンサに送信する。
受信機におけるステータス情報のタイムラインを評価するために、Age of Informationのメトリクスを用いる。
この問題を解決するためにRobins-Monroアルゴリズムを提案し、最適しきい値をほぼ確実に近似できることを実証する。
- 参考スコア(独自算出の注目度): 25.04993246830622
- License:
- Abstract: In this paper, we study a system in which a sensor forwards status updates to a receiver through an error-prone channel, while the receiver sends the transmission results back to the sensor via a reliable channel. Both channels are subject to random delays. To evaluate the timeliness of the status information at the receiver, we use the Age of Information (AoI) metric. The objective is to design a sampling policy that minimizes the expected time-average AoI, even when the channel statistics (e.g., delay distributions) are unknown. We first review the threshold structure of the optimal offline policy under known channel statistics and then reformulate the design of the online algorithm as a stochastic approximation problem. We propose a Robbins-Monro algorithm to solve this problem and demonstrate that the optimal threshold can be approximated almost surely. Moreover, we prove that the cumulative AoI regret of the online algorithm increases with rate $\mathcal{O}(\ln K)$, where $K$ is the number of successful transmissions. In addition, our algorithm is shown to be minimax order optimal, in the sense that for any online learning algorithm, the cumulative AoI regret up to the $K$-th successful transmissions grows with the rate at least $\Omega(\ln K)$ in the worst case delay distribution. Finally, we improve the stability of the proposed online learning algorithm through a momentum-based stochastic gradient descent algorithm. Simulation results validate the performance of our proposed algorithm.
- Abstract(参考訳): 本稿では,センサがエラー発生チャネルを介して受信機にステータスを転送するシステムについて検討し,受信機は信頼性の高いチャネルを介してセンサに送信する。
どちらのチャンネルもランダムに遅延する。
受信機におけるステータス情報のタイムラインを評価するために,情報時代(AoI)メトリクスを用いる。
本研究の目的は,チャネル統計(例えば遅延分布)が未知であっても,平均時間AoIを最小化するサンプリングポリシを設計することである。
まず、既知のチャネル統計に基づく最適オフラインポリシーのしきい値構造をレビューし、確率近似問題としてオンラインアルゴリズムの設計を再構成する。
この問題を解決するためにRobins-Monroアルゴリズムを提案し、最適しきい値をほぼ確実に近似できることを実証する。
さらに、オンラインアルゴリズムを後悔する累積的AoIが$\mathcal{O}(\ln K)$で増加することを証明している。
さらに,我々のアルゴリズムは,任意のオンライン学習アルゴリズムにおいて,累積的AoIは,最低遅延分布において,少なくとも$\Omega(\ln K)$のレートで,K$の伝送に成功したことを後悔する。
最後に,モーメントに基づく確率勾配降下アルゴリズムを用いて,提案したオンライン学習アルゴリズムの安定性を向上する。
シミュレーションの結果,提案アルゴリズムの性能を検証した。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Learning-augmented Online Minimization of Age of Information and
Transmission Costs [24.873041306990288]
我々は,送信コストと安定化コストの合計を最小化し,最悪の性能保証を実現するために,オンラインアルゴリズムを開発した。
オンラインアルゴリズムは堅牢だが、概して保守的であり、典型的なシナリオでは平均的なパフォーマンスが劣っている。
学習強化アルゴリズムは一貫性と堅牢性の両方を達成することを示す。
論文 参考訳(メタデータ) (2024-03-05T01:06:25Z) - Posterior Sampling with Delayed Feedback for Reinforcement Learning with
Linear Function Approximation [62.969796245827006]
Delayed-PSVI は楽観的な値に基づくアルゴリズムであり、後続サンプリングによる雑音摂動により値関数空間を探索する。
我々のアルゴリズムは、未知の遅延が存在する場合に、$widetildeO(sqrtd3H3 T + d2H2 E[tau]$最悪の後悔を実現する。
遅延LPSVIのための勾配に基づく近似サンプリングスキームをLangevin動的に組み込んだ。
論文 参考訳(メタデータ) (2023-10-29T06:12:43Z) - Provably Efficient Neural Offline Reinforcement Learning via Perturbed
Rewards [33.88533898709351]
VIPeRは、ランダム化された値関数のアイデアと悲観主義の原理を一致させる。
オフラインデータを複数回摂動することで、暗黙的に悲観性を得る。
ニューラルネットワーク関数近似を用いた一般的なマルコフ決定過程(MDP)において、証明可能かつ計算的に効率的である。
論文 参考訳(メタデータ) (2023-02-24T17:52:12Z) - Optimal Algorithms for the Inhomogeneous Spiked Wigner Model [89.1371983413931]
不均一な問題に対する近似メッセージパッシングアルゴリズム(AMP)を導出する。
特に,情報理論の閾値よりも大きい信号と雑音の比を必要とする既知のアルゴリズムが,ランダムよりも優れた処理を行うための統計的・計算的ギャップの存在を同定する。
論文 参考訳(メタデータ) (2023-02-13T19:57:17Z) - Online estimation and control with optimal pathlength regret [52.28457815067461]
オンライン学習アルゴリズムを設計する際の自然なゴールは、入力シーケンスの時間的変動の観点から、アルゴリズムの後悔を束縛することである。
OCOや盗賊など、さまざまなオンライン学習問題に対して、データ依存の「病的」後悔境界が最近取得されている。
論文 参考訳(メタデータ) (2021-10-24T22:43:15Z) - Machine Learning for Online Algorithm Selection under Censored Feedback [71.6879432974126]
オンラインアルゴリズム選択(OAS)では、アルゴリズム問題クラスのインスタンスがエージェントに次々に提示され、エージェントは、固定された候補アルゴリズムセットから、おそらく最高のアルゴリズムを迅速に選択する必要がある。
SAT(Satisfiability)のような決定問題に対して、品質は一般的にアルゴリズムのランタイムを指す。
本研究では,OASのマルチアームバンディットアルゴリズムを再検討し,この問題に対処する能力について議論する。
ランタイム指向の損失に適応し、時間的地平線に依存しない空間的・時間的複雑さを維持しながら、部分的に検閲されたデータを可能にする。
論文 参考訳(メタデータ) (2021-09-13T18:10:52Z) - Channel Estimation via Successive Denoising in MIMO OFDM Systems: A Reinforcement Learning Approach [23.57305243608369]
本稿では,強化学習フレームワークに基づく周波数領域の復調手法を提案する。
我々のアルゴリズムは、実用最小二乗推定法(LS)よりも大幅に改善されている。
論文 参考訳(メタデータ) (2021-01-25T18:33:54Z) - Aging Bandits: Regret Analysis and Order-Optimal Learning Algorithm for
Wireless Networks with Stochastic Arrivals [24.897224064639406]
信頼できないチャネルに時間感知情報を送信するソースを持つシングルホップ無線ネットワークを検討する。
学習アルゴリズムは1つのペア(ソース、チャネル)を選択し、選択されたソースは選択されたチャネルを介してパケットを送信しようとする。
学習アルゴリズムの目的は、ネットワーク内の年齢情報(AoI)を$ T$のタイムスロットで最小化することです。
論文 参考訳(メタデータ) (2020-12-16T00:58:26Z) - Debiased Off-Policy Evaluation for Recommendation Systems [8.63711086812655]
A/Bテストは信頼できるが、時間と費用がかかり、失敗のリスクが伴う。
提案手法は,履歴データに対するアルゴリズムの性能を推定する手法である。
提案手法は,最先端手法よりも平均2乗誤差が小さい。
論文 参考訳(メタデータ) (2020-02-20T02:30:02Z) - Channel Assignment in Uplink Wireless Communication using Machine
Learning Approach [54.012791474906514]
本稿では,アップリンク無線通信システムにおけるチャネル割り当て問題について検討する。
我々の目標は、整数チャネル割り当て制約を受ける全ユーザの総和率を最大化することです。
計算複雑性が高いため、機械学習アプローチは計算効率のよい解を得るために用いられる。
論文 参考訳(メタデータ) (2020-01-12T15:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。